漢語方言中「有音無字」的書寫問題

─從閩南語俗曲唱本「歌仔冊」的用字來看─

Last update 2002/05/31

 

王順隆

 

漢語方言(以下泛指南方方言)的漢字表記,在華人社會中一直難以推廣,唯有在香港每天有許多特殊的報章雜誌以獨具地方色彩的漢字編印出刊,提供給當地民眾各種生活訊息。可見在現今所有的漢語方言中,只有粵語已經成功地發展出一套漢字書寫系統,而且深植於民眾的日常生活中。漢語方言書面文字不發達的主要原因,除了傳統文人的偏執觀念作祟以外,所謂「有音無字」的現象更阻礙了發展。如此現象的發生,主要肇因於以下幾點:

 

1.      來自非漢語的外來借語。既然語源本非漢語,自無漢字可記。如閩南語借荷蘭語savon而成sap bûn(肥皂)。

2.      語音經過長時間的不斷演化,使得音義脫節,其語源已不可考或被遺忘。

3.      原為複數音節詞的語音經過融合,成為單音節詞。如:普通話「不一樣」讀作biàng。

4.      方言特有的語氣助詞、副詞、擬聲詞、擬態詞等虛詞。如:ngiāo ngiāo sô(蠕動狀)。

 

其實,即便官話在白話文初興之時也曾出現過「有音無字」的困擾,只是在經過一段長時間的自由創作,自然淘汰和官方規範之後,方才漸次沉澱出一套完整的書寫系統[1]。可見,方言漢字書寫的成功端賴「持續創作」、「適者生存」的內在因素;而官方的「統一規範」雖是一種最有效率的外來助力,但除卻官話以外,未見有任何方言享有如此服務[2]。方言文字在中國歷朝皆是任由「自生自滅」。

閩南語在過去也曾有過發展漢字書寫的環境。至遲自明末以來,透過地方戲戲文的刊印,就以漢字記下了閩南口語;而清代至二戰開始前,閩南語俗曲唱本「歌仔冊」的盛行更帶動了大量口語文學作品的問世,讓閩南語書寫文字深入了民間。可惜,戰後台灣政府為了推行國語,貶低方言的地位,詆毀方言的文藝,扼殺方言的創作,使得民間持續了數百年的母語文學創作風氣被摧殘殆盡。如此經過戰後數十年的空窗期,終於使得原已爭得立足地的閩南語「舊式」書寫文字幾乎為人遺忘。

本稿分析百餘年來風行於閩南、台灣地區,以閩南語口語所記之「歌仔冊」的用字,並汲取粵語書寫文字的成功經驗,以探討如何以漢字書寫方言中「有音無字」的原則問題。

 

【過去的方言書寫法】

漢語方言自古就存在,然而符合現代語言學標準的方言口語資料卻只見於數百年前。在過去漢語方言口語通常以兩種方式書寫。一是完全以音標符號代替漢字,如清末開國後西洋傳教士為各方言所創的教會羅馬字。已知至少有廣東話、廈門話,潮州話,上海話,福州話,莆仙話,溫州話,客家話,寧波話等方言的聖經。這種刨根式——­­完全捨棄原有文化基礎的革命性做法,歷史上也不乏成功的例子,如越南的古文字「字喃」於17世紀被法國殖民政府改成拉丁文字;西元1444年朝鮮王朝的李世宗改漢字為表音文字的諺文至今。但在華語社會中,表音文字化雖然於清末開始就常常有人鼓吹倡導,卻都無疾而終。如:日治時期,蔡培火曾為台灣話設計一套特殊的拼音文字,倡議效法日文廢棄漢字[3];解放後,中國政府也曾試圖為解決文盲問題而改採拼音文字。

第二種是仍舊以表意文字的漢字書寫,但加以各種新造文字和借用同/近音字、訓讀字等權宜的方式補現有文字之不足。吳語彈詞、粵語木魚書、福州評話、潮州歌冊、閩南語歌仔冊、客語傳仔等說唱刊本都是以漢字書寫方言口語文學的代表性作品。以漢字書寫雖然在解決有音無字的問題上效率較差,而且難度較高,歧見較多,但漢族語言數千年來均通用此法,可見漢字在漢人社會中的影響力。

除了上述兩種方式以外,近年在台灣更有人提倡仿效日文假名與漢字並用的做法,即所謂「漢羅並用」的書寫法──與官話音義相符的部分,便以漢字書寫,而將無適切漢字的音節改以拼音文字代替。如聖經的〈創世紀〉:『一切事物ee起源,在ti上帝創造宇宙萬物。起頭ee時,地是空虚混沌,深淵黑暗。』[4]

第一種方式與權宜的「漢羅並用」係以音標符號代替文字,故任何音節都能以符號拼出,而不存在「有音無字」的問題。贊成者認為,此法無論對讀者或是創作者而言,不失為方便而有效率的偏方﹔然而堅持漢字書寫的反對者則批評無論從視覺上或文化上言之,採用拼音文字無異是離經叛道之舉。其實,表音文字化的最大阻力是由於現今教育普及,民眾識字率極高,已不同於過去的文盲社會。要求已經習得漢字者放棄過往所學的一切文字,再重新學習另一套截然不同的文字系統,必然會招來抵制。須知,漢字的最大詬病在於學習困難,一旦學成,其缺點就不存在了。因此,在可預見的未來,漢字的地位在華人社會中應只會更加地穩固。

 

【歌仔冊的用字】

自明代以來刊行的閩南語戲文,其中的對白已經展現了濃厚的地方語言色彩。甚至當時的許多特殊用字直到今日仍為民間所沿用,如:卜、尫、障、阮、、夯[5]。清代,刊行俗曲唱本的風氣傳至閩南,致使更多的方言文學作品不斷問世[6]。更由於唱本售價低廉,用語用字通俗易懂,使其影響層面迅速擴大至中低階層的廣大群眾。因此,「歌仔冊」的用字最能代表閩南語的通俗文字。

為分析「歌仔冊」的用字習慣,本稿選用了一本目前仍在台灣發行的《勸少年好子歌》(見書影)為樣本,統計其所有歌詞4004字的用字法[7]。其結果如下表:

 



音義一致

   

同/近音字

訓讀字

形聲造字

非形聲造字

傳統俗用字

出現字次

2625

862

290

25

64

138

總百分比

65.5%

21.5%

7.2%

0.6%

1.5%

3.4%

方言字百分比

 

62.5%

21.0%

1.8%

4.6%

10.0%

(百分比小數點一位以下捨去)

 

l        音義一致:凡閩南語的讀音與語義皆符合傳統漢語音韻及字義者,即所謂「本字」。約佔全體漢字之65%。

l        同/近音字:讀音相同或相近,但字義不符合者(以下簡稱同音字)。這部分佔35%所有非本字中的62%強,足見閩南語借用同音字書寫是主要的手法。惟,這些同音字中尚有一小部分原有本字卻誤用了同音字。如:「廣話」為「講話」之誤;「可連」為「可憐」之誤。

l        訓讀字:讀音不符,但字義相符者,全文共找出24字:(e)(lang)(phòng)(kiaN)(na)(gao)(phang)(o)(phah)(thiaN)(m)(lan)(tak)(che)(bah)(tng)(kho)(chhe)(bai)(khia)(chuaN)(kao)(ta)(phaiN)。訓讀字出現字次佔所有非本字的21%。

l        傳統俗用字:音義皆不符,但該字於閩南語文學作品中由來已久,而且已為民間所熟悉者。共有11字:(beh)(gun)(e)(kah)(e)(phaiN)(mih)(a)(mai)(ba)(gia)。出現字次約佔非本字的一成。

l        形聲造字:以聲部加形部所成之新字,只有5字:(thai)(chun)(hua)(ang)(lam)。出現次數不足2%。

l        非形聲造字:非形聲字的新造字。只有6字: (thit)(tho)()(lang)(chhua)丿(phiet)。所有新造字於歌詞中出現次數加起來不過佔非本字的6.4%,是所有用字法中最少的類型。

 

從上表中可以明確地看出新造字是閩南語書寫文字中最不為選用的手法,反而借用同音字最為民間的創作家所喜愛。類似(thua)(a)(ho)(gun)(he)(te)(kho)」(新竹竹林書局《姨仔配姊夫歌》),此句歌詞從字面上無從理解,唯有以閩南語讀出字音後才能知曉本義「抽屜給我放肥皂」。其中「仔」、「阮」是閩南語傳統的用法,「茶」字或許符合語源,其餘四字皆為同音借字。

閩南語俗曲唱本多用同音字的結果,使得每一個漢字不再如同普通話般具有固定的字義,而只是單純的表達字音,因此非精通閩南語文白讀音者不能解讀。又因漢字成了純粹的表音文字,故以為數不多的漢字理論上就足以書寫所有的閩南語[8]。筆者過去曾依自建的[閩南語俗曲唱本「歌仔冊」全文資料庫][9]統計過所有的韻字字頻,從全文超過150萬字中取得韻字188822字次,但絕對字數只有3229個漢字[10],而且其中超過半數的1625個字只出現了10次以下,共計4332字次[11]。一般民眾如果按照字頻識字,則可得下表的結果:

 

出現順位

100字

300字

500字

1000字

1500字

出現字次

86787

129500

150164

173785

182859

可解讀百分比

45.9%

68.5%

79.5%

92.0%

96.8%

 

根據上表,理論上只要學習500個漢字就能解讀近八成的閩南語文書,再多記500個漢字,就足以理解92%的文章。這就是借用同音字的最大優點。

再從所有的用字來看,除了新造字為生字以外,其餘不論同音字、訓讀字或傳統俗用字幾乎都是選用現代教育中所謂的「常用漢字」。綜合上述分析,正好說明了過去閩南方言漢字書寫的最大基本原則就是「儘可能使用最少,最常用的漢字」。如此的做法雖然造成同音字氾濫,而衍生了許多錯別字,但在失學情況嚴重的舊社會下,不但減輕了閱讀者的負擔,也能讓更多的人參與創作,豐潤地方文學。

當然,多用同音字並非上上之策。在過去民智未開時,使用常用漢字的同音字是讓庶民大眾易於親近的做法,失學民眾是從語音去理解文意,而不是從字面去解讀,所以不受字義的干擾。但在現今,受過教育者長時間從書報雜誌接觸到受過語意規範的文字資料,因此對於每個字詞都已經在大腦裡連結上一個定義。當同音字出現在前後文不對應,超越過去的經驗法則的情況下,反而會由於讀者的既有語文知識而產生干擾[12]。如竹林書局《李三娘汲水歌》中的一段歌詞:

 

越入房內換武裝 穿甲一身金廣廣 穿甲有綉金龍鳳 一身辦甲真適當
身軀辦甲真整齊 真正英勇少年家 身騎白色兮駿馬 上山打獵孤單个

 

前兩個「甲」字對不黯閩南語者來說,理所當然地會解讀為名詞的「盔甲」。其實這段歌詞中所有的「(kah)」字在閩南語應該都是表示狀態的助詞,相當於普通話中動詞之後的「地」。如此的例子時常造成判讀的困擾,如果作者在創作當初能依詞類將用字適當地區別,以相同聲部再增加形旁的「呷」或「佮」代表虛詞的話,定可省卻許多無謂的麻煩。

再者,從前表中得知閩南語通俗文學中約有兩成的同音字必須先讀出正確的音後,才能依音循義。而眾所週知,閩南語的文白異讀現象在所有漢語方言中最為普遍,一個漢字常有兩個以上的閩南語讀音。作者為文選用同音字時,不知原來借用的是該字的文讀音或是白話音,甚或是近似音,致使連以閩南語為母語者都難以揣測作者的本意,而讀出正確的字音,再據而理解其意。事實上,現今的閩南籍人士如果不精於閩南語音,或習慣於閩南語通俗文學的用字習慣,已經無法順暢的閱讀這類作品,更遑論自行創作。可見,順手借用同音字的手法已經不再符合現代社會的需求了。

 

【漢語方言的書寫原則】

  近年來,台灣島內母語運動興起,文字的問題不早日解決,母語文學勢必難以推展。然而如前所述,書寫閩南語的風氣中斷了數十載,使得今人無法再承續過去的傳統書寫模式。更隨著語言知識的普遍化之後,許多人為了一個「有音無字」的音節,因襲傳統訓詁學、聲韻學的理論,從傳抄了千百年的各種古籍、韻書中發掘所謂的「本字」。如[13]

 

漖、覕、絯、馦、慒、冇、冇、僝、絿、淀、糒、粞、勼、踅、躼、涗、溛、毿、飷、晟、敥、縖、煠、贌、抈、簎、抭、捽、朾、迮、譟、歕、瞵、扐、惔、諞、訹、熇、淖、磑、鏏、饙、泔、趖、橈、劗、滰、搑、喌、蹐、欱、寽、薅、疕、爿、撆、舓、齕、齧、揾、騣、脰、髀

 

這些千辛萬苦考證出的本字,有的或許讓人信服,有的卻難以茍同,不過它們大多有一個共同的特質─「冷僻罕見」。罕見字是已經幾乎不再使用的漢字,從字面不但不知其音,也不解其義,除非一一加注或翻閱厚重的字典。

再者,對現代人來說諸如上述的本字,不論其音義如何符合訓詁學及音韻學的理論,作為一個表達方音的文字(或稱符號),已經完全失去了其功能。因為隨著時代的演進,即便是過去所經常使用的漢字在今天很多已經成為非常用字、罕用字甚至廢字。過去民間所愛用的同音字或是訓讀字,縱然經不起現代語言學理論的考驗,但是卻還能發揮一半的功能,擇其一表達音或義,比起已毫無功能的冷僻字實用多了。基於現階段急需實用性的方言文字,以推廣方言文學,應該讓「本字考」專屬學術領域,而鼓勵民間使用符合現代人語感的文字。

  什麼才是解決有音無字困擾的理想方案呢?相對於喜用同音字的閩南語,粵語方言書寫的成功經驗頗值得重視和借鏡。我們從幾本粵語白話刊物《新廣東話聖經》、《新編廣東省城白話》、《四淫齊》及多部木魚書中挑出了許多方言字[14]

 

l        同音字:的、呢、個、邊、點、米、而家、企、埋、郁、耐、緊、執、番、度、攝、至、聽、尋、重、第、竇、添

l        形聲造字:哋、嗰、喺、呷、啫、啲、咁、噉、嘢、吓、唔、嘅、唨、咗、嚟、啱、喇、喐、咆、哂、咯、哴、咕、嘞、嚿、嘥、呃、啤、噃、啩、噲、嗌、叻、口廟、口佐、口架、口聽、趷、癐、蹘、躝、攞、贃、偔、煲、睇、俾、揸、慳、梗、佢、搵、笪、焗、儎、撻、樖、足吉、火及、亻攵、忄磨、貝舌、貝子、亻鳥、扌生、扌戒、足企

l        非形聲造字:孻、屘、冇、瞓、乸

l        訓讀字:孖、靚、跛、凹、屈、歪

 

顯而易見地,粵語處理「有音無字」的方法與閩南語最大的不同是形聲造字遠多於同音借字[15]形聲字除了造字簡便之外,還能引導讀者依漢字的聲旁發音;而加上形旁造成新字,也能避免發生語言干擾而發生詞義混淆的弊病。既有借用同音字的優點,又改善了同音字的缺失,故粵語的手法確實比閩南語的傳統寫法好多了。

粵語漢字書寫的成功絕不光是因為多用了形聲造字,必須將社會、文化背景,語言環境甚至政治因素等都考量在內,但是長年以來迎合漢字傳統衍生原理的正確路線[16],也是不可忽視的助力。在這方面,其他漢語方言如果要發展漢字書寫,無疑必須師法粵語。

綜合以上所有的缺失利弊,並考量諸般現實環境,我們提出以下幾點書寫漢語方言「有音無字」的原則:

 

1.        考證本字非但效率不佳,且所得本字常冷僻少用,對現代人而言反而難以接受。而且正確的考證本字,只有具備專業知識者方能為之,一般人在寫作方言文學遇到用字的困難時,無法及時解決。更遑論有很多字詞原來即無本字[17]

2.        沿用已深植於民間的傳統用字,含訓讀字、俗用字、新造字。閩南語中的「(lan)」、「(ang)」、「(gun)」、「(beh)」、「(chhua)」、「   (thit)(tho)」等。

3.        缺字以新造字填補,儘量不借用同音字或近音字,以免詞意干擾。

4.        新造字以形聲字為宜。形聲字不但便於造字且能表音,如此即能快速取代非本字中的同音字。

5.        聲旁採用同音或近音之常用獨體字,形旁則儘量選用符合詞意之部首。

6.        現階段鼓勵自由創作,只要是符合民間需求的漢字,日久自然適者生存。

 

【主要參考書目】

l       不詳 《繪圖四淫齊》,光緒丁未年新會龍度四郎序,石印一冊

l       不詳 《新編廣東省城白話》,許雪航,曼谷文化鑄字公司

l       1936 〈台灣に於ける國字問題〉,蔡培火,《教育》第四卷第八號

l       1991 《台語根源》,鄭天福,漢風出版社

l       1992 〈談「歌仔冊」所使用的台語漢字及詞彙〉,王順隆,日本國立筑波大學人文學類學士論文

l       1992 《台語文學與台語文字》,洪惟仁,前衛出版社

l       1994 〈閩台「歌仔冊」書目˙曲目〉,王順隆,《台灣文獻》45卷3期

l       1996 〈「歌仔冊」書目補遺〉,王順隆,《台灣文獻》47卷1期

l       1996 《台語書面化研究》,臧汀生,前衛出版社

l       1997 《新廣東話聖經》,香港聖經公會

l       1997 〈台語用字ê再思考〉,陳弘昌,《母語教育研討會論文集》

l       1997 〈台灣歌仔簿押韻現象考察——以《人心不知足歌》為例〉,林慶勳,第五屆國際閩方言研討會

l       1997 〈閩南語字彙用字的幾個原則〉,楊秀芳,《母語教育研討會論文集》

l       2000 〈粵方言用字一百多年來的演變〉,黃小婭,《第七屆國際粵方言研討會論文集》

l       2000 〈臺灣閩南語歌仔冊的用字分析與詞彙解讀--以「最新落陰相褒歌」為例〉,姚榮松,《國文學報》,29

l       2001 〈廣州方言訓讀字的百年演變〉,黃小婭,《中國語文通訊》60期

l       2002 〈台語的訓讀字〉,林慶勳,第四屆台灣語言及其教學研討會

l       2002 〈「歌仔冊」的押韻形式及平仄問題〉,王順隆,《民俗曲藝》136期



[1] 直至今日仍有未統一的例子。如:常見「滿」好的、「蠻」好的。卻少見有以「瞞」、「謾」、「蹣」等同音字書寫者。更有許多年輕人的派生新語尚未有固定漢字。

[2] 任何自然語言都是先有語言,後有文字。因此,所有的文字都是憑藉「約定俗成」或「官方規範」才能通用,否則只能稱為「暗號」。如中國古代的琴譜、琵琶譜等都是用特殊的自創文字記譜,這些看似方塊字的記號也只有習樂者才能理解。

[3] 蔡培火〈台灣に於ける國字問題〉

[4] 台灣長老教會總會台語聖經新譯委員會委員林繼雄編寫。

[5] 見《明本潮州戲文五種》。

[6] 已知存世書目超過1500部,刊行地區橫跨廈門、泉州、漳州及台灣各地,發行年代則從乾隆年間至今。參見〈閩台「歌仔冊」書目˙曲目〉及〈「歌仔冊」書目補遺〉。

[7] 讀音的審定依據內容相同之錄音帶「全文勸少年」(月球唱片公司發行)。

[8] 這種將表意文字改為音標符號的方式,與日本古代使用漢字表示日語五十音的模式相類似,只不過日語同一個音節固定使用同一個漢字,久而久之這些漢字便簡化成了現在的假名符號。

[9] 網址為http://plaza16.mbn.or.jp/~sunliong/kua-a-chheh.htm

[10] 除了為數不多的介詞和連接詞不會出現在句尾之外,其餘的字詞理論上都應包含在內。字頻最高的前十字及次數依序為──伊(4975)來(2746)知(2682)去(2238)人(2235)起(2229)意(2130)時(2105)死(1992)兒(1708)。

[11] 參見王順隆〈「歌仔冊」的押韻形式及平仄問題〉。

[12] 當一套書寫文字已經規範超過很高比例後,剩下的少許部分雖然不解,但讀者可依前後文推測全文的意義。但若在一個句子中,有過多的字詞不能依經驗法則判斷的話,就難以解讀了

[13] 擷自鄭天福《台語根源》,陳弘昌〈台語用字ê再思考〉,楊秀芳〈閩南語字彙用字的幾個原則〉。

[14] 香港政府公佈的「香港增補字符集-2001」共收入新字4818字,但其中大多數係異體字或簡體字,並非全為粵方言俗用字。

[15] 粵語文字中也有同一音詞用字不統一的情形,但因為使用形聲造字,所以都能從其聲旁解其音而通用於民間。如:口佐、咗、唨都是表完成的語尾助詞。

[16] 自古以來,新創漢字皆以形聲字最為便利而實用。現有漢字80%以上為合體字,而合體字的90%以上皆是形聲字。

[17] 前述「有音無字」發生的原因中,除了第2條因語音變化使音義脫節者之外,其餘都絕無本字。