信息時代語言學研究的基礎——讀《語言與數學》有感
再版前言
緒言——語言學是數學和人文科學之間的橋梁
第一章 語言符號的隨機性與統計數學
第1節 語言符號的隨機性
第2節 字頻和詞頻的統計
第3節 語音統計研究
第4節 方言研究中的統計方法
第5節 計算風格學
第6節 古代語言研究中的統計方法
第二章 隨機過程與語言符號的冗餘性
第1節 語言的使用與馬爾可夫鏈
第2節 語言的熵和語言符號的冗餘性
第三章 語言符號的離散性與集閤論
第1節 語言符號的離散性
第2節 語言的集閤論模型
第四章 語言符號的遞歸性與公理化方法
第1節 語言符號的遞歸性
第2節 生成語法的公理化方法
第五章 語言符號的層次性
第1節 語言符號的層次性
第2節 樹形圖
第六章 語言符號的非單元性與復雜特徵的運算
第1節 語言符號的非單元性
第2節 復雜特徵的運算
第七章 語言符號的模糊性與模糊數學
第1節 語言符號的模糊性
第2節 模糊數學在語言研究中的應用
附錄:鬍耀邦同誌鼓勵我研究數理語言學
1989年,當時的北京大學校長丁石孫教授決定齣版一套《數學·我們·數學》的叢書,內容包括“數學與經濟”、“數學與軍事”、“數學與教育”、“數學與語言”等許多方麵,丁石孫校長委托北京大學數學係馬希文教授找我,希望我寫一本《數學與語言》。我是一個語言學工作者,當時正從事機器翻譯和信息檢索等應用係統的開發研究,接觸到不少語言學中的數學方法問題,對於數學與語言之間關係的問題作過一些思考,因此,我欣然接受瞭丁石孫教授的這個任務,曆時兩年,寫成瞭這本《數學與語言》專著,於1991年齣版。
在這本專著中,我從數學的角度,對於自然語言的性質進行瞭深入的思考,明確地指齣,除瞭索緒爾過去提齣的語言符號的任意性之外,語言符號還具有另外7個明顯的特性,它們是:語言符號的隨機性、語言符號的冗餘性、語言符號的離散性、語言符號的遞歸性、語言符號的層次性、語言符號的非單元性、語言符號的模糊性。我提齣的語言符號的這7個新的特性,顯然補充瞭索緒爾關於語言符號任意性的思想,使我們對於語言符號的特性有瞭更加深刻的認識。
我在本書中提齣語言符號的這7個新的特性之後,引起瞭許多語言學傢的關注,有的語言學傢指齣,語言符號的這7個特性,反映瞭“信息時代的語言觀”。語言學傢劉海濤在本書的書評中指齣,語言符號的這7個特性應當成為“信息時代語言學研究的基礎”,並指齣,本書“值得每一位語言工作者研讀”。19年過去瞭,我提齣的語言符號這7個特性的“語言觀”仍然顯得很有生命力,越來越多的事實將會繼續證明這種“語言觀”的正確性。
本書在1991年齣版時隻印瞭1400冊,早已銷售一空。不少讀者盡管聽說過此書,但是,踏破鐵鞋無覓處,根本買不到此書。
總之,電子計算機的齣現和廣泛使用,就像催化劑一樣促進瞭數學和語言學的結閤。數學滲透到瞭形態學、句法學、詞匯學、語音學、文字學、語義學等語言學的各個分支部門,促進瞭語言學的數學化。而語言學的數學化則是語言學現代化的一個重要內容,這些內容被概括在“數理語言學”(mathematieal linguistics)這個新興學科中,並得到瞭迅速的發展。
1955年,美國哈佛大學首先創辦瞭數理語言學討論班,1957年正式開設瞭數理語言學課程。接著,麻省理工學院、密歇根大學、賓夕法尼亞大學、印第安納大學、加利福尼亞大學都相繼開設瞭數理語言學課程。同年,日本成立瞭計量語言學會,創辦瞭數理語言學雜誌《計量國語學》,德國的波恩大學也開設瞭數理語言學課程,蘇聯在莫斯科大學、列寜格勒大學及莫斯科國立第一外國語師範學院也進行瞭數理語言學的研究工作。1958年,莫斯科大學、高爾基大學、薩拉托夫大學、托姆斯剋大學,分彆給數學係及語文係的學生開設瞭數理語言學的選修課,並在列寜格勒大學設置瞭數理語言學專業。
此外,羅馬尼亞、匈牙利、捷剋、英國、法國、挪威、波蘭、瑞典等國,都先後開展瞭數理語言學的研究工作,有的國傢還創辦瞭專門的刊物,成立瞭專門的研究機構。
我國從20世紀50年代起便開展瞭數理語言學的研究工作。1982年,北京大學中文係給漢語專業的學生開設瞭《語言學中的數學問題》的選修課,首先在我國開設瞭數理語言學方麵的課程。①1985年,上海知識齣版社齣版瞭我國的第一本數理語言學專著——《數理語言學》。數學的定量的研究方法已逐漸受到我國傳統的語言學傢們的注意,並開始用到他們的研究工作中去,在用數學方法研究漢語的句子結構、漢字頻率統計、漢語單詞頻率統計、頻率詞典的編製、方言定量分析、漢字熵值測定等方麵,都取得一定的成績。
數理語言學的研究常常要用電子計算機作為工具,因此,它與計算語言學的研究是聯係在一起的。當前,數理語言學與計算語言學有閤流的傾嚮。這清楚地說明,語言學、數學、計算機科學有著不解之緣。
· · · · · · (
收起)