《下一步,AI。NEXT,愛》金聲三號 (李琳山)、雅婷逐字稿 (杜亦瑾)


八〇年代,個人電腦問世,歐美邁入文件電子化的資訊時代,而台灣卻還在使用龜速打字機。科學界開始討論該如何開發中文輸入法,李院士卻超前部署,試圖直接用聲音來輸入。就這樣,他一腳踏進語音辨識研究,但馬上遇到一個難題:西方既有的語音辨識,在台灣完全用不上。


中央研究院 李琳山院士:

中文的一字一音,一個字只有一個音的,而這個音的總數是有限的,總共一千三百多個。但是這一千三百多個音,我們的字

絕對不是一千多個,我們字很多很多,所以就有很多同音字,然後我們當然有個很明顯的跟西方語言不同的是,我們有聲調。

語音辨識不斷融入生活場景,人類幾乎隨時隨地都在跟機器對話。

在台灣,最具代表性的應用,就是雅婷逐字稿,由PTT創辦人杜奕瑾 帶領台灣AI實驗室所開發。

 

台灣AI實驗室 創辦人杜奕瑾:

我們習慣是跟誰學習就叫這個專家的名字。唐鳳政委不是有一個隨身書記官叫做薛雅婷嗎?她是可以中打一分鐘三百多個中文字的,這種事情我們有沒有可能用人工智慧來做逐字的這種需求,所以我們就把我們這個語音辨識,做了一個很簡單的介面,就叫做雅婷逐字稿。