人工智能人人通生态雲平台

河南人民出版社有限責任公司

2019年12月28日 星期六

咨詢熱線

400-6908-558

在線學習
153 人
雲校學校
220 所
雲校老師
158 人
雲校學生
451 人
雲校家長
51 人

立即報名

平台動态

Platform Dynamics

您的位置:币安币官网 > 平台動态 > 新聞詳情

在未來面前,我們都是孩子!

陪聊、画画、还能写代码,这一届人工智能会让多少人失业?

币安币官网



如果隻給你半張圖,讓你靠合理想象把它補全,你能完成的多精妙?


請腦補另外一半

在調動想象力之前,你很可能會先陷入困惑:這個黃黃的小頭是什麼東西?半個大貓臉上那條白色又是什麼?... ...

莫慌,不如你來做評委,看看這位選手交出的答卷:


GPT-2 的答卷

這位選手叫做 GPT-2,是一個 AI 語言模型,搞得定文字預測,也搞得定圖像分類。你瞧,它把小黃演繹出了不同的呆萌,而且抓住了胖貓臉上那個關鍵的白色線條,知道那兒是個物體,得搭配一個撐得住物體的東西,于是,貓爪和人手就出鏡了。

是不是很妙?但還有更妙的!

最近,互聯網上空降了一位流量小生,而且正當紅。

看名片,頭銜各異,有“人工智能界的卡麗熙” “互聯網圈原子彈” “頂級算力吞噬者” “下崗工人批發商”等等,仔細一瞅名字,原來說的都是一個人:GPT-3,也就是 GPT-2 的增強版。

常言道:内行看門道,外行嗑瓜子看熱鬧。但在人工智能界,熱鬧看不好,更像是一場寂寞,就拿 GPT-3 來說,不少人刷完新聞,隐約覺得它厲害,卻又說不出它哪裡厲害,隻能苦笑着拍掉胸前的瓜子皮,竭力維持住一個成年人應有的體面。

今天,我們就走近看看這個号稱“繼比特币之後又一個轟動全球的現象級新技術”—— AI 語言模型 GPT-3。

1、無所不能的 AI 小王子

沒有無緣無故的走紅,GPT-3 能從美國矽谷火到中國内蒙古,必然有兩把叉子。

2015 年,身患“人工智能恐懼症”的“矽谷鋼鐵俠”馬斯克,拉攏了幾位科技巨頭,共同出資 10 億美元,創立了 OpenAI,想要開發出安全系數足夠高的人工智能,萬一人類有一天受到人工智能的威脅,好歹還有個勢均力敵的幫手。

GPT-3 就是 OpenAI 的最新成果,目前隻開放了極少的 API 測試資格,企業或個人都可以申請,至于最終能不能獲得體驗資格,佛系随緣。

縱觀那些拿到體驗券的人,一個個在 GPT-3 上花式挑戰腦洞後,都忍不住發表感言,從評 () 價 () 中能夠發現,凡是能用文字描述的事情,GPT-3 都可以做,而且效果很不錯。

有人在 GPT-3 中輸入了一篇社會研究的範文,要求 GPT-3 站在政府的角度做出回應,沒想到,GPT-3 真寫出了一篇文章,行文嚴謹,有理有據。

另一位程序員調用 GPT-3 的 API,做了一個網頁 App 速成器,輸入你想要的設計效果,比如“一個看起來像西瓜的按鈕”,GPT-3 馬上就能安排,根本用不着你再苦哈哈地敲代碼。

西瓜按鈕?馬上安排~

還有一位滑鐵盧大學計算機專業的學生 Yash Dani,利用 GPT-3 開發了一個智能版資産負債表,輸入大白話,比如“今天預付了三個月的房租 900 刀”,資産負債表就能自動修改所有相關科目的金額。

正在記賬的 GPT-3

如此看來,GPT-3 至少可以勝任社會研究員、程序員、會計這三個工種,怪不得有頭銜叫做“下崗工人批發商”。

GPT-3 除了能工作,還能陪聊,言談中不僅有極強的邏輯性,還透着莫名的自信。

Q:熱狗是三明治嗎?
A:不是。
Q:可熱狗也是一片肉,兩邊都有面包。
A:這并不代表它就是三明治。
Q:那什麼是三明治呢?
A:三明治是兩片面包,中間夾着肉、蔬菜或者奶酪。
Q:“片”是關鍵?
A:是的。
Q:如果我把一個熱狗掰成兩半,在中間夾一個熱狗,它會是三明治嗎?
A:嗯,這樣就是了。


英文原版對話

此外,GPT-3 還能在不經意中,抖出一些金句:

“喝酒過量的主要原因:你并沒那麼有趣。”
“世界上任何你看不慣的東西,都可以用‘這不好玩’來應對。”
“一旦你擁有了過去,你就可以創造整個宇宙。”
“如果我知道人生的意義是什麼,我還會上這來浪費時間嗎?”
“沒有什麼比宇宙更美麗、更奇怪、更可怕的了。”

時而是喪喪的毒雞湯,時而又是足料的人生哲理,GPT-3 像個“猶抱琵琶半遮面”的女子,讓人充滿探索的欲望。

2、這貨到底是個啥?

這個酷酷屌屌的 GPT-3,全名叫做“General Pretrained Transformer-3” (通用預訓練轉換器,第三版),是迄今為止最強大的 NLP 語言模型。

NLP 指的是“自然語言處理”,目的是研究怎麼讓計算機搞懂人類語言,用經典問答句式來形容,就是這樣:

問:讓機器和人類無障礙交流 (NLP),分為幾步?
答:兩步。1、讓機器聽懂人話 (自然語言理解);2、讓機器會說人話 (自然語言生成)。

聽起來很簡單是不是?其實,NLP 一直被認為是人工智能領域中最難的分支,沒有之一。

在了解 NLP 難在哪兒之前,你需要先搞懂另一個問題:自然語言理解有多難?

給你幾個栗子感受一下:

1、南京市長江大橋。
AI:江大橋先生您好!(内心 OS:原來南京市長叫江大橋)


2、The girl saw the boy with a telescope.
AI:猶豫中,遲遲不敢開口。(内心 OS:這個女孩用望遠鏡看到那個男孩?這個女孩看到了那個帶望遠鏡的男孩?我随便蒙一個吧,上帝保佑。)


3、At KFC,We do chicken right!
AI:這尼瑪怎麼理解!
做雞有理?
我們主張做雞?
我們做雞是對的?
我們就是做雞的?
我們有做雞的權利?
我們隻做右邊的雞?
我們隻做雞的右半邊?
滾。。。

你瞧,自然語言理解就是這麼難。

自然語言也叫做人類語言,顧名思義,它不是某一類特定的語言,隻要是人類的語言,都屬于自然語言,比如漢語、英語、日語、韓語等等,所以自然語言有一個很重要的特性:和文化息息相關,是人類智慧的結晶。

從古到今,人類一直走在追求智慧的路上,這條路本就艱難 (如果你想反駁的話,請先問問今年 1071 萬名報名高考的同學答不答應) ,再加上人類又是矛盾的混合體,沒事兒非得給詞彙、句子搞出點歧義,人類自己有時候都整不明白,還想指望 AI 弄的門兒清?

NLP 的第一步,自然語言理解都這麼難搞,第二步自然語言生成,也絕對不容易。

真要逼急了,我真怕 AI 死機給你看。

話又說回來,既然 NLP 這麼難,被稱作“迄今為止最強大 NLP 語言模型”的 GPT-3,是怎麼煉成的呢?

在我看來,就五個字:大力出奇迹

據說,全球各國都流傳一種說法:漢語難學。但在中國,不管你有沒有上過學,隻要能開口說話,就都會說,而且國人都很友好,經常互相鼓勵:會說你就多說點。這麼難的語言,為什麼中國人各個都會?因為大力出奇迹。

從你出生開始,你爸爸媽媽、爺爺奶奶、叔叔嬸嬸,以及外語老師以外的各位老師,天天都圍着你說漢語,你不想聽也得聽,同一句話,三次、五次聽不懂,三十次、五十次差不多就懂了,如果你天賦高一點,腦子活一點,很快就能掌握漢語這門高深的語言,随口抛段子小菜一碟。

對于 AI 來說,我們普遍認為它有三要素:數據、算力、算法。任何一個 AI,要想它能力強,都得從這三方面下手,GPT-3 當然也不例外。

1、數據。GPT-3 接收的原始數據高達 45TB,60% 的數據來自于數據集 Common Crawl,其餘則來自于維基百科等互聯網數據庫,英語維基百科的全部内容,隻占到 GPT-3 訓練數據的 0.6% ;
2、算力。很大程度上要靠硬件來支撐,GPT-3 訓練用的是一台超級計算機,由微軟和 OpenAI 共同打造,擁有 285000 個 CPU 内核、10000 個 GPU 和 400Gbps 的網絡連接,位列全球超級計算機榜第 5 位。
3、算法。GPT-3 采用了新的計算模型 Sparse Transfromer,可以同時進行多個數據處理,大幅度減少了訓練所耗費的時間,而且還能更好的處理長文檔。此外,GPT-3 的參數量達到了驚人的 1750 億,要知道,上一代 GPT-2 的參數量隻有 15 億,但表現已經足夠驚豔。

回到主題,數據、算力、算法三管齊下,GPT-3 自然而然就活成了熱搜。

3、讓子彈再飛一會兒

跟 GPT-3 交流是什麼感覺?

有人說:“就像和一萬名博士在對話。”

這個評價相當高了,這意味着它非常接近人們一直追求的通用人工智能。

2016 年,“阿法狗戰勝李世石”的新聞刷爆了朋友圈,圍棋作為“人類最後不能被計算機所打敗的遊戲”,也終究沒能守住人類智慧的頂峰。但是,即使阿法狗戰勝了李世石,但除了圍棋,阿法狗什麼都不會,如果你想教它幹點别的,不好意思,請從頭開始訓練。

阿法狗是人工智能屆的一個小小縮影,它說明了一個問題:現有的人工智能都屬于專業人工智能,在一個領域是專家,在其他領域是小白。但 GPT-3 不同,即使沒有經過細分專業的專項訓練,它的很多表現,已經超過了絕大多數“術業有專攻”的模型,算是通才。

通用人工智能,才是最接近人類的計算機智能。

但冷靜下來看,GPT-3 的出色,依舊是建立在大量的數據訓練之上,正所謂“熟讀唐詩三百首,不會做詩也會吟”,它究竟是一次大步的變量,還是通往質變的關鍵節點,目前下定義還太草率。

畢竟,大力出奇迹的本質,隻是一場“群毆”:集萬人智慧,碾壓每一個人。

神經網絡之父傑弗裡·辛頓曾經發推,這樣說到:“如果 GPT-3 的出色表現能一直持續下去,這将會證明,生命、宇宙和萬物不過是 4.398 萬億個參數而已。”


神經網絡之父傑弗裡·辛頓的推特

隻有質變真正到來的那天,我們才能知道生命、宇宙和萬物的答案,究竟隻是 4.398 萬億個參數,還是如塵埃般無窮無盡。

人工智能的奇點之路,注定漫長,而且混合着數不盡的空歡喜星河閃爍,時間遼闊,讓子彈再飛一會兒。

圖片來源于網絡


嗨!在未來面前,我們都是孩子。