過去二十年,無數中國人學會了使用電腦后,都患上了一種“病”:提筆忘字。
對著一張白紙,腦子里想的字呼之欲出,卻怎么也寫不出來。
病根大家都知道:拼音輸入。
拼音輸入是一種真正的“無記憶、無障礙”的輸入法,幾乎統治了現在的漢字輸入法市場。
但是很少人知道,在90年代以前,拼音輸入根本沒有市場,“以形為主”的漢字輸入法才是主導,那個時候,學電腦就是學WPS和五筆字型。
那拼音輸入到底是怎么發展起來的呢?
0 1
明快打字機
之前看過一個中文鍵盤輸入法的搞笑圖:
這幅圖充分說明了中文輸入的難點:字符實在太多了,常用字就有3500個。
不像英文的26個字母,每個字母都有鍵盤對應,所見即所得。
所以,中文信息處理的前輩們考慮的第一個問題就是,如何用較少的鍵來處理更多的漢字。
20世紀40年代,著名作家,《京華煙云》的作者林語堂發明了一個叫做“明快”的中文打字機。
他自創了一種“上下形檢字法 ”,放棄了筆順,只要知道一個漢字的左上和右下部分,就能完成輸入。
但是漢字眾多,只靠左上和右下的部分,可能會出現同樣結構的字。
林語堂就把這些同樣結構的字放到一個叫做“魔眼”的窗格中,用數字的方式來選取。
對于一個字來說,需要按三次鍵:首鈕,末鈕和數字鍵。
林語堂把打字的過程變成了一個搜索的過程,這已經有了點現代輸入法的雛形。
這個小小的、機械結構的打字機,竟然承載了8000多個漢字,可以想象,背后的設計和編碼都是非常巧妙的。
實際上,從醞釀想法到做出來,明快打字機花費30年之久,耗資12萬美元(40年代,這是個天文數字),林語堂甚至賣掉麥哈頓的房子,背負了一身債務。
1946年,林語堂向美國專利局遞交了專利申請,開始尋找可以生產打字機的公司,雷明頓打字機公司表示了興趣,邀請林語堂去做一次演示。
悲催的是,像很多偉大產品的演示一樣,尷尬的事情發生了,按下打字機的一個鍵時,機器沒有反應。
故障雖然容易解決,但林語堂失去了和雷明頓打字機公司合作的機會。
林語堂四處奔走,利用自己多年積累的全部關系網來推廣,依然沒有公司敢于冒險生產這個復雜的機器。
這個天才的機器就這么夭折了。
0 2
SinoType
如果說林語堂的明快打字機還需要獨特的鍵盤的話,那么1959年問世的SinoType則率先實現了用QWERTY鍵盤來輸入中文。
SinoType的發明人是麻省理工的教授考德威爾,這是一位邏輯電路設計領域的頂尖專家。
考德威爾剛開始并不懂中文,在一次和學生的聚餐中,學生李凡向他解釋說漢字書寫有一套標準的筆畫,當不同的人書寫同一個漢字時,使用的基本筆畫是相同的。
也就是說,中文是有“拼寫”的,中國人總用同樣的方式來拼寫一個字。
考德威爾立刻意識到,他可以建立一個邏輯電路來控制這個過程。
考德威爾和李凡等人研究了中國古代的書法歷史,確定了使用21個基本筆畫,然后又分析了每個筆畫出現的頻率,這樣在電路設計中,可以把最短的編碼分配給最常用的筆畫。
每個筆畫,在鍵盤上都有一個鍵來對應。
例如想輸入“牛”,需要按GBBD。
但問題是“午”,也是GBBD,為解決同形異義詞問題,考德威爾像林語堂那樣,用數字1,2,3來選擇。
SinoType計算機的測試結果也令人振奮,在鍵盤上練習20小時以后,中文輸入速度可以接近英文打字速度。
考德威爾進一步研究發現,很多時候,對于多筆畫的漢字,操作員通常只需要輸入幾個筆畫,SinoType就能匹配到正確的漢字!
漢字的“最小拼寫長度”實在是驚人,只要達到最小拼寫長度,實際上就可以鎖定鍵盤,不用輸入了。
考德威爾在不知不覺中發明了“自動完成”的功能。
1960年考德威爾猝然離世,SinoType失去了首席科學家,更重要的是,五角大樓認為,作為宣傳戰的武器,“Sinotype”的殺傷力還不夠大。
沒錯,在冷戰時期,SinoType被賦予了意識形態斗爭的重任。
造出了原型機以后,SinoType被束之高閣。
0 3
牛棚中的發明
支秉彝曾是留學德國的博士,電信工程和測量儀器專家,曾任上海市電工儀器研究所所長。
1968年,他被誣為“反革命學術權威”,關進“牛棚”,那段時間,陪伴他的只有墻上的八個大字:“坦白從寬,抗拒從嚴”。
支秉彝怔怔地看著這八個字,驟然間萌發了一個研究想法:能不能把漢字編成一種有規律的代碼,用以替代打電報的老辦法?
更進一步,能不能進而讓漢字同西文一樣直接進入計算機?
支秉彝憑早年在德國任教漢語的根基,潛心思考,運用26個字母逐個編碼漢字。
當時,支秉彝手頭有筆,卻沒有紙,就利用茶杯蓋子,幾十個漢字編滿了,抹了再編。沒有字典,就憑記憶。
1969年,支秉彝離開“牛棚”,去勞動改造,掃地,看守倉庫,閑下來的時候繼續研究編碼。
之前無論是林語堂“明快”還是考德威爾的“SinoType”,他們都喜歡以字型為基礎進行分析和分類。
但是支秉彝有了一個全新的武器:漢語拼音。
新中國成立初期,我國文盲率達80%,為了能迅速改變落后面貌,中國開展了漢字簡化、推廣普通話和制定推行漢語拼音方案三大任務。
1958年,中國公布了由漢語拼音方案委員會制定的《漢語拼音方案》,并迅速在全國推廣。
拼音的誕生,不但開啟了“語同音”的時代,也為漢字輸入提供了全新的思路。
他仔細研究和總結了國外編碼方法的優缺點,創造了打破單一分解漢字字形的方式,與眾不同地綜合分析漢字字音、字形、筆劃和拼音之間的關系。
關鍵是用26個字母進行編碼,以4個字母表示一個漢字,規則簡單,易于掌握。
如“路”字,可拆成口、止、文、口四部分,取部首拼音讀音的第一個字母,即組成“路”的代碼KZWK 。
這種編碼方案建立在字音和字形的雙重關系上,見字就能識碼,見字就能打碼,不必死記硬背,并且可以用普通鍵盤來輸入。
1978年,支秉彝發布了他的“見字識碼”系統,引發國內轟動。
1983年,上海儀器儀表研究所以“支碼”為基礎,為全國50多個單位提供了電腦漢字信息處理技術和設備,標志著我國電腦漢字信息處理進入了應用推廣階段。
0 4
五筆字型
林語堂的“明快”打字機和SinoType采用的是字形檢字法,支秉彝的“支碼”用的是字形拼音結合法,這么發展下去,簡單易學的純拼音輸出法應該出現了吧?
其實并沒有,拼音輸入法最大的問題是重碼率高,每個音節都有數十個備選!
記得早期的智能ABC輸入法,那叫一個慢,每次輸入完畢,還得手工翻頁選詞,極其麻煩。
解決這個問題的辦法就是用詞庫來保存各種各樣的詞,短語,這樣就能從打字變成打短語,甚至打句子。
然后,即使是最基礎的詞庫,也需要幾百M空間來保存,那些包含專業術語、網絡用語和口音變體的詞庫,更是高達幾個G。
80年代和90年代初期,電腦硬盤都很小,也就幾十M到上百M,是沒法玩兒拼音輸入法的。
所以,還是折騰字形吧。
同樣在1983年,一個僅僅占用幾百K空間的輸入法問世了:五筆字型。
它的發明人是河南南陽人王永民。
五筆字型不僅小巧,而且打字速度超快,它鍵碼短、輸入快,多簡碼,一個字或一個詞組最多只有四個碼。
普通人每分鐘可以輕松達到120~140字,而專業人士可以達到200字以上。
在"五筆字型全國大賽"中,在"錯一罰五"的嚴厲比賽規則下,21歲的女孩王君創下了每分鐘輸入293個漢字的世界記錄,人眼一分鐘也就能看300個字左右,王君的錄入速度已接近人眼瀏覽極限。
五筆字型唯一的問題是:學起來太難!
用戶得掌握拆字技巧,記住口訣,然后反復練習指法,很費時間。
但是,80年代計算機還是絕對的“高科技”產品,它的使用者多為辦公人員或專業技術人員,這些人對輸入效率要求較高,愿意花時間學習五筆字型。
五筆字型雖然學習門檻高,但掌握后回報率極大,所以五筆就迅速成為輸入法領域的老大了。
那時候一說學電腦,就是學WPS,加上五筆字型,各位文印店里的電腦五筆字型是標配,那些年輕的打字員雙手翻飛,打起字來劈里啪啦,蔚為壯觀。
0 5
拼音稱霸
90年代后期,電腦配置越來越高,像我第一臺電腦,已經有了4.3G的硬盤了,拼音輸入法所需要的字庫慢慢不再是障礙。
2000年3月,紫光拼音輸入法推出了最新版,共收錄了8萬多條名詞、短語、地名以及人名等詞匯,一經發布便受到廣泛好評,并迅速普及開來。
2006年6月,馬占凱創造性地把搜索和輸入結合起來,推出了搜狗輸入法,它通過搜索引擎技術,將互聯網變成了一個巨大的“活”詞庫。
“活”詞庫可以隨著熱點不斷自動更新,以往的輸入法都打不出那些詞,搜狗輸入法都能搞定。
這種互聯網的思維方式,搜狗輸入法得以后來居上。到了2009,搜狗輸入法竟然占據了80%的市場份額!
后來,QQ輸入法,百度輸入法,Google輸入法層出不窮,但無一例外,走的全是拼音的路子,五筆字型慢慢收縮到了專業人士使用的領域。
至于它們搞彈窗廣告、捆綁軟件之類的惡行,那是后話了。
從字形到拼音,中文輸入法度過了40多年的時光,技術的發展給人們提供了便利,也帶來了提筆忘字這種普遍的現象。
未來會怎么樣呢?
剛才,我看到孩子對著手機在說話,她正在用語音輸入寫一篇文章,這也許就是未來的趨勢吧!
參考資料
《中文打字機》
《漢字王國》
《THE CHINESE COMPUTER》
《中國工程師史 第三卷》漢字編碼技術的創立者
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.