什麼是AI?
什麼是機器學習(ML)?
什麼是深度學習(Deep Learning)?
什麼是資料探勘(Data Mining)?
什麼是大數據(Big Data)?
儘管身為近幾年最熱門的科技名詞,也有許多人每天接觸這些科技,但這些名詞仍舊非常容易被混淆。
TL;DR
Artificial Intelligence
原本是用來指稱「如何使機器通過圖靈測試」的一系列研究。現今AI已逐漸成為商業與行銷用詞,可能泛稱所有與自動化相關的技術。
Machine Learning
機器學習用於在資料中尋找pattern,進而分類、辨識、預測、估計一系列未知標的。現已逐漸成為非深度學習的機器學習技術的代稱。
Deep Learning
深度學習是一種機器學習技術。其應用強項為影像、聲音、時間序列、語言等具備局部性性質的資料。
Data Mining
資料探勘是一門從巨量資料中尋找未知洞見的技術。其中可能牽涉統計、機器學習、domain know-how等一切手段。
Big Data
大數據探究的是如何處理巨量資料。其中包含如何系統性的取得資料、如何有效率的存取資料、以及資料探勘這種挖掘商業價值的工作。
What is Artificial Intelligence
I propose to consider the question 'can machines think'?
Turing, Alan
1950年,計算機之父Alan Turing提出著名思想實驗——Turing Test (圖靈測試),嘗試去回答機器是否可能像人類一樣思考。圖靈測試中,你需要去分辨一個封閉的房間中的受試者是人類還是機器。當然不是瞎猜,你可以在紙條上面寫上你想問的問題,傳入房間內。受試者會回答你的問題,並把答案回傳給你。如果你無法通過這種問答模式分辨出房內是人還是機器,則該受試者通過了圖靈測試,而通過圖靈測試被認為是擁有如人類般的思考能力。
在此之後,計算機領域的各路好手開始去研究如何能使機器通過圖靈測試。這一系列研究在後來被統稱為人工智慧(AI)。有專門下棋的deep blue與alpha go,有專注聽懂人話的Siri和Alexa,也有Tesla的自動駕駛,這些都是比較廣為人知的AI應用領域。
但事實上,應用領域並非判斷是否為AI的標準,實作方法才是。
AI泛指一切能根據自身環境,採取最大可能達成目標之行動的系統
Poole, Mackworth
以偵測垃圾郵件為例。有兩套專門偵測垃圾郵件的軟體,姑且稱他們A-ware與B-care。在收到信件後,他們都會檢查信件主旨、寄件者、以及內文,來判斷信件是否為垃圾郵件,但兩者判斷方式是不同的。
A-ware有一個黑名單,只要信件是黑名單中的某人寄的,就將該信件標示為垃圾郵件,而使用者也可以編輯這個黑名單。另外,A-ware的使用者也可以自行輸入某些例如「廣告」、「特價」的關鍵字,只要將來有任何郵件的主旨包含這些單詞,A-ware就會把他歸類為垃圾郵件。最近,A-ware也提供了黑名單共享機制,讓使用者不必自行定義黑名單,也可以匯入別人建立的黑名單,使得垃圾信件的防護更加完善。
另一方面,B-care公司在研發階段就收集了大量的垃圾郵件以及一般郵件,通過自然語言處理分析郵件語意,將數以萬計的語意聚類為數百種大方向,再通過二元分類器將這幾百種語意方向歸類為垃圾或一般。產品發佈後,B-care的使用者可以透過反饋錯誤判斷的類別,使B-care得以藉此強化現有的分類方法。
同樣都是垃圾郵件偵測軟體,A-ware和B-care都能夠成功的幫助使用者排除垃圾郵件。但即便兩者都需要人的幫助(A-ware有人工輸入的黑名單,B-care擁有大量人工分類好的垃圾與一般郵件),只有B-care才有使用AI技術,而A-ware則會被認為是rule-based system。因為A-ware的過濾規則是人設計的(是否在黑名單),而B-care的過濾規則不是人設計的,人設計的是「生成過濾規則」的流程,諸如自然語言處理等等。
我們能夠很快的辨識一個人是否禿頭,卻很難給出少於幾根頭髮算是禿頭。
the bald man paradox
然而近期,AI一詞愈發氾濫,許多自動化工程也被冠上AI的噱頭。比起指稱產品的實作方法,AI更像是一個行銷用詞。例如一台標榜具有AI省電功能的冷氣,就算工作原理是低於25度就用低速運轉、反之就用高速運轉,也完全不會令人感到意外。
什麼是機器學習?敬啟期待下一篇文章。
Top comments (0)
Some comments may only be visible to logged-in visitors. Sign in to view all comments.