小C自制的爬蟲是有一套默認的方案選擇邏輯的。
具體使用通用網絡爬蟲,還是聚焦網絡爬蟲、增量式網絡爬蟲等等,還有一些搜索模式的選取,會根據所給定的要求進行選擇,一般情況下還是可以保證正常輸出結果的。
在某搜索引擎被占據第一頁搜索結果的情況下,偶爾使用一下爬蟲,感覺還是可以的。
不過,距離真正的自動編程,這個還差的遠。
但是隨著積分的投入,相信也不會太遠。
蘇航又擺弄了幾下電腦,突然想起一件重要的事。
這東西有什么用?
你要什么程序,只要描述妥當,小C基本就能自動生成出來,包括結果。
那還要它輸出一段代碼做什么用啊?
比如找出最值,它都已經能識別出最值來了,我還要它把是被最值的代碼生成出來,我這不是閑得慌嗎?
蘇航看著電腦上那幾個G的文件夾,里面全是小C訓練用過的編程代碼,這有什么用?
編程本就是為了讓計算機明白要什么解決問題,并且自動解決它。
程序員只是把這個問題“翻譯”成了機器能夠聽懂的語言而已。
最終的結果就是,機器聽懂了人類的問題,并解決了問題,把結果用人類能夠看懂的形式表現出來。
而現在呢?
小C聽懂了蘇航要做什么,然后它成功地解決了這個問題,并把這個結果用一個編程語言描述出來,然后再把這個編程語言“翻譯”成人類的自然語言。
蘇航就得到了一個編程語言的答案和一個自然語言的答案。
然后呢?
問題是原本就要自然語言答案就夠了啊,我還要這個代碼做什么用?
蘇航靜坐在書桌前。
為什么要生成一段代碼出來?
要說有用,那自然是有用,起碼蘇航在做一些編程項目的時候就可以讓小C替代一部分代碼編輯。
而且,這部分代碼可以光明正大拿出去,而不是得把小C也交出去,來證明自己的數據沒錯。
很多時候,當論文涉及一些代碼運算的時候都會要求附上代碼,用以驗證論文的真實性、數據的可靠性。
蘇航可以用小C簡化自己的編程工作嘛,也算是不錯。
想到這里蘇航輕松了一點,但是還是有一種穿雨衣、撐雨傘——多此一舉的感覺。
其實這要再往下挖,那就是可以說是“強”人工智能了,或者說,這本來就是一個“強”人工智能的方向:讓機器理解人類的自然語言,并作出反饋。
目前人工智能在圖像識別上已經接近人類的水平,但是在語音識別和自然語言識別上還是有一段距離。
比如,某個支付軟件里的“形色識花”,還有一些類似的圖片軟件,都可以像人類一樣識別圖片。
但是在自然語言識別這一塊就不同了,人工智能常常變成“人工智障”。
比如,“小X同學,打開微信,給‘青色的巖’發消息,說我已經把推薦票全投給你了。”
“好的,我將給青色的巖發消息:說我已經把推薦票全投給你了。”
喏,自然語言變化太多,而且很多日常用語會不遵循語法規則,像什么“使動用法”、“名詞作動詞”等等。
人工智能表示它太難了,除非是使用者正常的、按照語法規則來描述他要做的事情,目前的人工智能才能正確識別。
但是也僅僅是自動識別而已。
比如,“小X,打開qi’dian,搜索‘學習使我富裕’。”
“已為您打開qi’dian。”
然后就沒了,沒了。
這樣一來就顯得非常的多此一舉,我要這“智障”有何用?
類似的例子太多,這里就不一一列舉了。
至于自動編程,也是機器識別自然語言的一個方面。
這個問題其實可以描述為一個關于輸入和輸出的轉化問題,即通過一段代碼實現輸入字段對輸出字段的轉化,也就是學術上的“歸納程序綜合”問題。
對于這一問題,很多前沿科研人員也有不同的想法。
有的人覺得,我不需要知道它到底是怎么做的,只需要把不同代碼都試一試,讓最后的結果符合輸出字段就行了。
當然這里的都試一試不是隨機組合,而是指不斷學習轉化規則,最終實現正常輸出。
這一想法對于具體的代碼要求不多,注重于轉化規則和輸出結果。
也有一些人認為,要讓機器碼農像人類程序員一樣把解決問題的過程形成代碼片段。
給定一些代碼片段,然后利用深度學習來生成一個符合要求的模型。
這兩種方法,蘇航說不上誰對誰錯,因為目前國際上并沒有一個真正意義上成功的自動編程軟件。
最最優秀的也只是MATLAB中的Simulink模型自動生成代碼,這一塊已經可以說是非常厲害了。
而其它的嘗試還只是停留于紙面,或者實驗室。
而系統“送來”的小C,蘇航也說不清它到底是怎么學會的編程。
只能說,系統出品,必屬精品。
不過目前小C也做不來太大的工作,稍微復雜一點的語句,或者帶有主觀色彩的描述語句它都會識別錯誤。
而且最近幾次“投喂”積分,也只是稍微優化了一些邊角料的東西,比如可選擇的模型和代碼注釋,沒有像之前那樣發生質變。
蘇航也沒什么好辦法,只能繼續“喂”積分,看看什么時候才能積累出質變了。
也許下一次質變,將會出現一個小“賈維斯”也說不定。
不過小心起見,蘇航一般都是會斷開那臺移動工作站的網絡和電源,日常辦公學習也都是用那臺老電腦。
至于有沒有用,誰知道呢?
蘇航合上電腦,轉頭看向窗外。
一轉眼又要到暑假了。
去年的這個時候,他還在打算留校,打算用一個暑假準備補考數學,但是實際上卻如同咸魚一般,一小時自習里有五十分鐘在看手機。
那時的咸魚生活,雖然很閑適,看上去很舒服,但是并不快樂,每天上床睡覺都感覺自己非常空虛、非常累,但是偏偏又沒有學進多少東西,也沒有做什么,所謂的累,也只是心累而已。
而現在,日常奔波在圖書館和教學樓,連寢室也少有呆過,不對,每天還是有起碼三分之一的時間在寢室。
這樣的日子,反而更加充實、快樂、且有錢。