7799精品视频天天在看,日韩一区二区三区灯红酒绿,国产xxxxx在线观看,在线911精品亚洲

    <rp id="00a9v"></rp>
      <track id="00a9v"><dl id="00a9v"><delect id="00a9v"></delect></dl></track>
      1. 【徐振國】黃一農(nóng)院士以大數(shù)據(jù)研究紅樓夢的沖擊和啟示——對科技部政治學門的建言與辯白

        欄目:《原道》第31輯
        發(fā)布時間:2016-12-21 21:13:46
        標簽:

        黃一農(nóng)院士以大數(shù)據(jù)研究紅樓夢的沖擊和啟示——對科技部政治學門的建言與辯白

        作者:徐振國(臺灣東吳大學政治系兼任教授) *

        來源:《原道》第31輯,陳明 朱漢民 主編,新星出版社2016年出版

        時間:孔子二五六七年歲次丙申十一月廿三日丁丑

                  耶穌2016年12月21日

         

         

         

        作者按:這原來是給科技部政治學門的一封信函,寄出后獲得新任召集人吳重禮教授和前任召集人蘇彩足教授的善意回應,非常感謝。然而研究的契機稍縱即逝,當年的研究伙伴或已退休、或出國任職、我自己也已屆七十二歲高齡,已經(jīng)不具申請科技部研究計劃的資格。然而我相信我在文中所提的建言和辯白還是有意義的,故將原函修改成一般文章的形式,期能引發(fā)同好的討論和指教,是所至盼。

         

        前年(2014年,編者注)12月我看到《中國時報》所載《穿梭清史:黃一農(nóng)e考據(jù)解紅學》一文,覺得和我的研究方向相近,而我最后兩年的研究計劃遭到否決,一時深有感觸,故曾給當時的“國科會”政治學門召集人致函,表達我的一些看法。然而當時粗心大意,居然將一封還沒有寫完的網(wǎng)絡信件寄發(fā)出去,卻也收到召集人的回函,語多鼓勵,頓時讓我感到羞愧,立即回函致歉,表示在自己的意見更清晰之后會再陳述意見。

         

        后來,我認真拜讀了黃一農(nóng)院士的《二重奏:紅學與清史的對話》,的確是一本厚重扎實的著作,沿襲民清以來的紅學研究爭議,說明紅樓夢不僅是曹學芹個人的文學創(chuàng)造,其寫作的內(nèi)容,特別是大觀園元妃省親等處細節(jié),的確有其史實依據(jù)。另從更大的范圍來看,一農(nóng)院士不僅是在考據(jù)一部小說,而是呈現(xiàn)了清朝“遼人”(關外漢人)的生活方式和人情義理,對清朝的政治社會史產(chǎn)生了截然不同的看法。就方法論的概念而言,一農(nóng)院士是以全文檢索的方式,在六十億字的各類滿漢文檔資料進行搜尋、比對和解析,來建立自己的論述。他宣稱:“……隨著近年大數(shù)據(jù)(Big Data)的出現(xiàn),相關文獻的發(fā)掘反而邁向一嶄新局面,甚至相對于‘新紅學’或‘新索隱派’的發(fā)展模式而言,‘新新曹學’或‘新新紅學’的興起亦不無可能?!?/p>

         

        從黃一農(nóng)院士的著作,我想到若干年前和謝清俊教授的一次長談。謝教授是中文計算語言學的創(chuàng)始人,他認為此一新興學科非常符合中國的注疏考證之學。他舉《金剛經(jīng)》為例,經(jīng)文很短,歷代高僧注解金剛經(jīng)的文獻卻汗牛充棟。謝教授認為這背后有其獨特的思想運作邏輯,有別于西方的歸納法和演繹法。他提到屢次和西方科學家討論此一問題,后者認為西方思想的確偏重歸納/演繹邏輯,注疏考證的基本邏輯形式必須在中國或印度的古典哲學中去發(fā)掘。謝教授的說法極具啟發(fā)。我當時回應,作為現(xiàn)代政治科學根基的憲法便是一門注疏考證之學,憲法的法條不多,但長年以來累積的司法判例卻因應時空環(huán)境為憲法增添了許多新的解釋,并藉此貫徹了民主憲政生活。從方法論的角度,我還認為憲法解釋背后蘊含的詮釋科學方法論,可以和注疏考證之學連結,而獲得更高層次的提升。

         

        然而必須注意的是,大數(shù)據(jù)近年來獲得極大的重視,主要是從信息專業(yè)的角度提出主張,強調(diào)在統(tǒng)計、數(shù)學和軟件三方面下功夫,卻很少從人文社會科學使用者的立場提出需求和理論主張?,F(xiàn)從上述兩位學術先進的啟發(fā)以及自己長年做“國科會”研究計劃的一貫訴求,我認為大數(shù)據(jù)的功能兼具了實證科學方法論和詮釋科學方法論相互交融的特色。甚或可以說,大數(shù)據(jù)研究跨越了實證主義而進入到后實證主義,特別切合人文社會科學的發(fā)展趨勢。我現(xiàn)就此一觀點提出下面幾項意見和看法。

         

        第一,從“數(shù)據(jù)庫”到“意聯(lián)網(wǎng)”。黃一農(nóng)院士以“e考據(jù)”和“大數(shù)據(jù)”的概念利用多達六十億字的各類滿漢文檔數(shù)據(jù)庫研究紅樓夢。相應于此,各類媒體、官書、法律、史料的數(shù)據(jù)庫早已有非常龐大的累積,然而大多只是用于資料的查詢,還未發(fā)展出更深刻的用途和價值。然從當前科技發(fā)展的角度來看,自然科學界和和工商業(yè)界皆強調(diào)依據(jù)大數(shù)據(jù)的概念,落實成“物聯(lián)網(wǎng)”,并衍生成更具體的“車聯(lián)網(wǎng)”和“醫(yī)聯(lián)網(wǎng)”。相應于此,人文社會科學應該從語言和符號的基礎上出發(fā),發(fā)揮語言文字數(shù)據(jù)庫的功能,使其從“字聯(lián)網(wǎng)”形態(tài)進入到更深層的“意聯(lián)網(wǎng)”脈絡,藉快速檢閱各種龐大的文類和文本,而能解析人們各類語境中的“意向性”內(nèi)涵。

         

        第二,平衡語料庫。就技術層次而言,要大量有效的使用語言文字數(shù)據(jù)庫,必須認識在其背后的“語料庫”的運作。這是依循古典語言學家的“詞類標記”概念,不斷地搜集日常生活中各種文類的語句,分別標記出其中的名詞、動詞、受詞、形容詞等詞性,藉此可以全面地呈現(xiàn)某一社會在特定時空環(huán)境中的語言使用的狀態(tài)及其可能的變化。值得注意的是,計算機本身便是以0、1為基礎的數(shù)位語言,和人類的自然語言早就有相互啟迪和傳譯的關系。自1960年代,西方信息學界更是沿襲古典語言學詞性標記方法來開發(fā)電子語料庫,由此形成專業(yè)的“計算語言學”或“計算機語言學”。自1990年代初,采用西方計算語言學的發(fā)展而奠定了中文計算語言學的基礎,完成了“中研院語料庫”(Sinica Corpus),讓人們每天可以在計算機上快速地篩選我們需要的字詞。其實,當我們每天使用計算機和手機時,便會觸及到語料庫的運作。例如鍵入“政”字,后面便有“政治”“政黨”“政局”“政變”等有意義的字符串供我們選用,而不是在每一個字鍵入后都會跟著三千五百個左右的常用漢字,讓我們疲于篩選而放棄使用。

         

        第三,數(shù)據(jù)庫的使用途徑。面對龐大的各類數(shù)據(jù)庫,必須采用適當?shù)姆椒ê屯緩絹黹_發(fā)利用,在這方面用心的人很多,我自己長年做“國科會”研究先后意識到三種運用資料的方法。其一,大量制作數(shù)據(jù)庫之時,人們便開始運用關鍵語詞的特性來萃取資料。我早期制作的臺灣報紙社論標題等數(shù)據(jù)庫便是采用此一途徑。其后,我從當代語言學的發(fā)展脈絡來界定此一研究途徑的特性,而冠以“文本論述分析”的名目,希望能夠加深其學理意涵,而獲得更深刻的使用價值。其二,Roberto Franzosi發(fā)展的SAO過錄法,此須善用語料庫來界定語句中的詞性,如主詞、動詞、受詞等等,然后利用“主體-行動-[客體]”的基本語法模式,來解析一篇新聞報導中的敘事情節(jié),而能更精確地掌握到相關事件或議題的演變。其三,Michael Laver發(fā)展的文本內(nèi)容分析(textualcontent analysis,TCA),采用其自制的統(tǒng)計套裝軟件,將歐洲政黨的黨綱打散,萃取出其中有實質(zhì)意涵的單字,并以字詞出現(xiàn)的頻率與標準差進行排序,將新舊黨綱做一對照,而能從新黨綱中新產(chǎn)生的加權字詞中看到新政策概念的走向。值得注意的是,上述三述研究方法,只有以關鍵語詞為檢索資料的方法獲得非常散漫的使用,其他研究方法都還未獲得有系統(tǒng)的開發(fā),此乃因當今方法論學者還未充分認識當代語言學以及后實證主義科學哲學觀而形成之侷限。

         

        第四,重新認識當代語言學和詮釋科學方法論。前面提到,日常語言和計算機語言有其共通的特性而有其相互啟迪的過程,甚至由此發(fā)展成計算語言學,而直接影響了計算機文字檔和圖像檔的轉(zhuǎn)譯和呈現(xiàn)。依此線索,我們必須重新認識當代語言學的發(fā)展淵源。論者一般都認為當代語言學的創(chuàng)始人是索緒爾(F. De Saussure,1857-1913)。他從日常語言出發(fā),能看到“名”“實”之間的重要分際,而區(qū)分出“所指”(the signified)和“能指”(the signifier)兩個范疇,前者指名目概念或形式結構,后者指具體的聲光形象等實質(zhì)內(nèi)容,兩者合稱“符號”?!八浮焙汀澳苤浮敝g有其可能的對應關系,但又有各自的變通原則(rule或grammar)。這樣的語言學概念,可以呈現(xiàn)語言使用者的主觀運用空間,也能夠在約定成俗的基礎上達到“互為主觀”的溝通運作效果。

         

        另就邏輯的特性而言,索緒爾的語言學中蘊含了一種“二元模式”(the binary mode)。所謂“所指”和“能指”便是一種對立的二元,而兩者所指涉的“個體”及其所隸屬的“整體”也是一種對立的二元。此一二元模式超越了實證科學方法論所偏重的歸納法和演繹法,而進入到辯證邏輯的領域,超越了合黑格爾的“正、反、合”模式,卻更能契合當代現(xiàn)象學家Robert Sokolowski所說“顯性和不顯性”“整體和局部”“同一和多重”等三個基本形式結構。

         

        值得注意的是,索緒爾語言學后來經(jīng)維根斯坦等人后實證主義科學哲學觀的加持,經(jīng)Noam Chomsky以數(shù)理形式語言的面貌呈現(xiàn),再經(jīng)Teun A. van Dijk以論述語言學的方式彰顯,終于從1970年代開始在文史哲藝界大行其道,形成所謂“論述轉(zhuǎn)向”或“語言學轉(zhuǎn)向”的龐大趨勢。令人感到遺憾的是,當時政治科學正從行為主義轉(zhuǎn)變?yōu)楹笮袨橹髁x,卻停留在實證主義科學方法論的思維觀點而未能參與語言學轉(zhuǎn)向的新趨勢。錯失了這一環(huán)節(jié),使政治科學至今落后,而未能積極主動地參與大數(shù)據(jù)時代的理念主導和開創(chuàng)。另一方面,我也必須很嚴肅地指出,由于索緒爾是瑞士人,深深地影響了東歐和前蘇聯(lián)地區(qū)的語言學發(fā)展。此外,辯證法的邏輯思考也加強了索緒爾當代語言學的發(fā)展?;诖艘粋鞒?,中國大陸學界對當代語言學以及相關后現(xiàn)代概念的銜接要比我們深刻寬廣。基于此,中國大陸計算機硬件的發(fā)展不如我,然而軟件以及網(wǎng)絡商業(yè)模式的發(fā)展卻超過我。此外,大陸人士有“話語權”“潛規(guī)則”等說法,也反應了其背后不同的語言學認知基礎。追本溯源,我們不能不注意兩岸在當代語言學和邏輯思維兩項源頭上的差異。

         

        第五,若干辯白和補述。我100年和101年的研究計劃被否決,當時按程序提出申覆未果,故曾致函承辦人林芳美女士表示“不為申覆只為原則”,現(xiàn)仍沿此一方向提出一些辯白和補充。

         

        1.關于實證政治科學方法論的發(fā)展困境。我早從86年度的研究計劃開始,便強調(diào)我是以方法論駕馭我整個的研究計劃,核心概念是追求實證科學方法論和詮釋科學方法論的融合,根源是取自Donald Moon在1975年TheHandbook of Political Science一書中的一篇長文。然而,我逐漸發(fā)現(xiàn)Moon對于詮釋科學的語言學觀點和辯證邏輯的認識不深,跳脫不出實證主義的“律則涵蓋解釋”思考模式,違背他自己文章的宗旨,反而去推崇當時正在崛起而偏重演繹邏輯的理性抉擇政治學。他的退縮受到G. Almond的奚落,也受到W.Riker的嘲諷,反批他沒能真正了解理性抉擇政治學的妙用。對于Moon的失敗以及所引發(fā)的爭議,我認為是政治科學方法論發(fā)展過程中的一件大公案,由此錯失了「語言學轉(zhuǎn)向」和「論述轉(zhuǎn)向」的契機,徒使政治學方法論偏重實證經(jīng)驗研究,而無法維護長期以來以公法、公共論述和政治思想為基礎的傳統(tǒng)政治學,也無法順利進階到后實證主義而難以適應當前大數(shù)據(jù)和信息科學的發(fā)展趨勢。我在“國科會”的研究計劃中屢次提到這一問題,也不斷有文章檢討,然而未受重視。我2013年發(fā)表的一篇最具代表性的論文,《政治科學改造運動的爭議和啟發(fā):從“通則”到“脈絡”的轉(zhuǎn)向》,可以更詳細地說明我這一方面的意見。

         

        2.關于主要代表作的認定問題。在研究方法和研究技術方面,我自2005有重大改變,采用M. Level的文本內(nèi)容分析(textualcontent analysis, TCA),試圖將其文字計數(shù)軟件引進到中文世界。然而,我和我的研究團隊低估了中文在斷詞上的困難,連續(xù)兩年未能達到預期的測試效果,“國科會”因此終止了我2008年度的續(xù)約,理所當然,毫無可怨。可慶幸的是,此時我受到瞿海源教授之邀約,參與《社會及行為科學研究方法:質(zhì)性研究法》一書之寫作,負責其中“內(nèi)容及文本內(nèi)容”一章之規(guī)劃和撰寫。我深知這是檢討我整個研究計劃的一個大好機會,花了三年的時間,七易其稿,主編也為我做了字斟句酌的??薄T诖藢懽鬟^程中,我對實證內(nèi)容分析和詮釋文本分析作了詳細的分辨,并形成本函前面提到的一些變化。然而遺憾的是,計劃審查人看不到該項代表作的實質(zhì)內(nèi)容,而貶低為“一篇教課書文章”。我要強調(diào)的是,瞿編研究方法是一次非常用心的編著工程,邀約了四十余位各領域的專家,將1978年楊國樞教授編著之后三十余年的研究方法發(fā)展,做了一次概括性的整理和呈現(xiàn)。況且,此一系列專書是要為博碩士研究生以及年輕學人提供一本研究方法的參考模板,絕不是一本普通的“教課書”。

         

        3.關于文本內(nèi)容分析在中文斷詞上的可能突破途徑。在2008年接受瞿海源教授的編書邀約之時,東吳大學特別給我經(jīng)費資助,讓我能夠繼續(xù)聘請信息助理來協(xié)助寫作,并檢討上述文本內(nèi)容分析測試失敗的原因。在此次寫作過程中,我深受Franzosi的影響,對當代語言學的發(fā)展和“論述轉(zhuǎn)向”有一更完整的認識,也對“SAO過錄法”“詞類標記”“語料庫”有更貼切的了解。循此,信息助理廖文偉利用“中研院語料庫”和既有的中英文翻譯軟件的基礎,制作了一個可以進行中文SAO過錄的界面,試圖以此作為中文“文本敘事分析”的基礎。至于如何改善中文的“文本內(nèi)容分析”,文偉主張放棄斷詞,僅用單字,便可達到中文計數(shù)的測試效果。郭豐州老師持不同看法,擔心以單字萃取太過單薄,容易扭曲原文本資料的內(nèi)涵,故主張另寫文字計數(shù)統(tǒng)計軟件,順應中文以及中文語料庫的特性,方能產(chǎn)生信度較佳的后果。我當時決定先以中文SAO過錄法做文本敘事分析,可以藉此更深入地了解中文語料庫的特性,然后再以單字或新統(tǒng)計軟件來測試中文文本內(nèi)容分析的可行性。可惜的是,前后這最后兩次的研究方案皆遭否決,而我自己也屆齡退休,遂使前后八年的研究工作成了一種無從收尾的狀態(tài)。

         

        4.服務器廢除后的尷尬處境:2008年研究計劃中斷之后,我用“國科會”研究經(jīng)費購置的服務器仍舊呈放在東吳大學信息中心,其后逐漸呈現(xiàn)失修狀況。我2013年退休之后,更因難以修復而予以拆除,存放在東吳政治系一位助教的辦公桌下,形同廢物。這對我形成兩個難堪的后果。其一,我在瞿海源教授編著的文章中,所標示的資料來源和運作界面都在此一服務器中,現(xiàn)在失了根源,讀者無從尋索。其二,歷來用了很多的經(jīng)費累積的資料,其中我最珍惜的是剪輯光復初期八分報紙而做成的社論標題數(shù)據(jù)庫,以及采集光復初期《臺灣銀行季刊》中“經(jīng)濟日志”而制成的財經(jīng)數(shù)據(jù)庫。社論標題數(shù)據(jù)庫后來曾利用“國科會”研究經(jīng)費向聯(lián)合和中時兩大報系購得社論本文而有相當完整的內(nèi)容。兩報系在簽約時也都同意可以在學術網(wǎng)絡上自由使用,不用于圖利,便無侵犯智慧財產(chǎn)權的問題。我曾利用此類數(shù)據(jù)庫寫過十余篇會議論文,包括“金融”議題之發(fā)展和“民主”意識形態(tài)之演變等等。早期,由于數(shù)據(jù)庫管理不善,每逢更換合作對象或更換服務器,文本資料容易出現(xiàn)亂碼。其后,經(jīng)過信息系同仁不斷修正,這個問題已大幅改善。我一直有一個心愿將這十余篇論文修改充實后刊登,現(xiàn)在整個服務器廢棄了,這個愿望也就很難達成了。

         

        我必須坦白地說,對最后兩次研究計劃遭受否決的事非常不滿,顯示當時的學門召集人委任審查人不當,擺脫不掉自己的本位立場。而如前所述,我整個研究計劃的核心關懷一直是在方法論層次,試圖打破實證科學方法論的狹窄視域,在詮釋科學上找到更寬廣的出路?,F(xiàn)就此一點來反觀黃一農(nóng)教授,原來是專業(yè)天文學家出身,以e化概念研究紅樓夢,大作中卻看不到一項統(tǒng)計數(shù)據(jù),也看不到一項軟件程序,而是不斷的以各類滿漢文本交互參照來展現(xiàn)當時人們的生活情境,甚至以一尊畫像的品題來呈現(xiàn)曹家開基祖先在八旗社會中的人脈關系,由此折射到紅樓夢中人物寫詩頌詞的生活情調(diào)。黃一農(nóng)院士的紅學研究為人文社會科學的大數(shù)據(jù)研究提供了一個好的示范,也在無意之間突顯了詮釋社會科學的方法論精髓,值得人文社會科學界的重視。

         

        責任編輯:柳君


        微信公眾號

        儒家網(wǎng)

        青春儒學

        民間儒行