其實伏羲是能進行無監督學習的。
所謂監督學習,就是我們告訴人工智慧某個特定輸入的正確答案。比如指示給人工智慧一幅汽車的影象,並告訴它正確答案是“汽車”。
這種學習方式之所以被稱為監督學習,是因為學習的過程類似於成人向年幼的孩子展示圖畫書。
成年人知道正確的答案,孩子根據前面的例子做出預測。這也是訓練神經網路結構的人工智慧和其他型別人工智慧學習體系結構最常用的技術。
比如說,告訴人工智慧,自己所居住的城市中大量房屋的描述及其價格,讓人工智慧嘗試預測你自己家房子的售價。
重要的是“告訴”這一環節,必須有智力正常的成人作為監督者。
而無監督學習,則是智力達到一定程度的生命體獨有的能力。
比如人類和大多數其他動物的學習,是在生命的前幾個小時、幾天、幾個月和幾年,以沒有人監督的方式學習:我們透過觀察、發出行動與世界接觸,得知我們行動的結果,以此來了解世界如何運作。
沒有人告訴我們所看到的每一個物件的名稱和功能,但我們能學會非常基本的概念,比如世界是三維的,物體不會自行消失,沒有支撐的物體會往下落。
伏羲也是有這種能力的。所以要讓它獨立發展出高階的視覺識別能力,也不是不可以,但需要非常強大的硬體基礎,以及非常漫長的時間。
而接受培訓專案,也就是接受“監督學習”,能大大縮短這一過程。
視覺識別能力,其實不像人們想像的那麼簡單。比如,一個智力正常的人類漫步在小區裡,看見一條薩摩耶和一條吉娃娃,雖然它們的外表相差很大,體型也不是一個量級,但我們能一眼就認出,它們都屬於“狗”。
看到兩條不同的薩摩耶,我們能很快分辨出,這條是樓上老李家的,那條是隔壁老周家的。
但是對於人工智慧而言,影象只是一串陣列。
伏羲的核心成分借鑑了深度學習系統,在深度學習系統中有一個特別有用的架構被稱為卷識神經網路。
當人工智慧需要識別一個影象時,它首先檢測組成這個影象的那一串陣列內的一小部分,由部分到整體。
例如物體的邊緣,在第一層卷識神經網路中能夠被輕易檢測出來。
而神經網路的下一層將檢測這些簡單圖案的組合所形成簡單形狀,比如汽車的輪子,馬的尾巴上的毛,蝴蝶翅膀上的鱗片,人臉的眼睛。
再下一層將檢測這些形狀組合所構成的物體的某些部分,例如人臉、腿部,馬的尾巴,蝴蝶的翅膀。
神經網路的最後一層將檢測剛才那些部分的組合:一輛汽車、一架飛機、一個人、一匹馬、一隻蝴蝶等等。神經網路的深度使網路能夠以這種分層次的方式識別複雜模式。
但是想要人工智慧學會識別這顆星球上的萬事萬物,數十億各不相同的人類和動物,就需要經過大量樣本資料庫的訓練。這也是為什麼伏羲需要那些大資料公司提供的訓練專案。