欧美成人A片免费|日韩无码一级av|一级黄色大片在线播放|黄片视频在线观看无码|亚洲精品成人无码影视|婷婷五月天视频网站|日韩三级AV在线播放|姓爱av在线婷婷春色五月天|真人全黃色录像免费特黄片|日本无码黄在线观看下载

  • +1

訪談︱魏希德:如何將數(shù)位人文工具M(jìn)arkus用于歷史研究

澎湃新聞特約記者 劉家隆
2017-02-10 10:10
來源:澎湃新聞
? 私家歷史 >
字號(hào)

【編者按】魏希德教授(Hilde De Weerdt)是比利時(shí)漢學(xué)家,致力于研究宋史。著有Competition over Content: Negotiating Standards for the Civil Service Examinations in Imperial China (1127-1276)(該書漢譯本《義旨之爭(zhēng):南宋科舉規(guī)范之折沖》2015年由浙江大學(xué)出版社出版)、Information, Territory, and Networks: The Crisis and Maintenance of Empire in Song China等專著。近年來,她嘗試用數(shù)位人文的方法進(jìn)行歷史研究,主持開發(fā)了Markus古籍半自動(dòng)標(biāo)記平臺(tái),引起了國內(nèi)外不少人文學(xué)者的關(guān)注。澎湃新聞特約記者、萊頓大學(xué)歷史學(xué)博士生劉家隆對(duì)魏希德教授進(jìn)行了專訪,主要談及了她的學(xué)術(shù)生涯、史學(xué)訓(xùn)練及其數(shù)位人文的最新研究成果。本文為該訪談的第二篇。

魏希德教授

澎湃新聞:近些年來您主要側(cè)重于用數(shù)位人文的方法開展學(xué)術(shù)研究,您最早是怎樣對(duì)數(shù)位人文產(chǎn)生興趣的?

魏希德:最近幾年我確實(shí)比較多地參與到了數(shù)位人文的研究當(dāng)中,但我從未想過要把它當(dāng)作我的主要關(guān)注對(duì)象,我對(duì)這一領(lǐng)域產(chǎn)生興趣也是極為偶然的。當(dāng)初,我有一段時(shí)間在集中閱讀12-13世紀(jì)的筆記,盡管從中找到了很多有價(jià)值的信息,但我發(fā)現(xiàn)很難把握我讀過的內(nèi)容。就像讀報(bào)紙一樣,這看一點(diǎn),那看一點(diǎn),但在你去教了兩三個(gè)月的課之后,就會(huì)發(fā)現(xiàn)很難再回到當(dāng)初的狀態(tài),因?yàn)橐呀?jīng)記不清讀過什么。那時(shí)候我很困擾,想找到更高效的管理筆記的方法。所以當(dāng)初我其實(shí)只是想知道怎樣才能做好筆記而已。

我剛開始的想法與其他人沒有什么不同,只是想找到一款已有的軟件,然后把軟件安裝好就可以開始工作了。那時(shí)候社會(huì)科學(xué)的研究者因?yàn)橐幚砗芏囝愋偷男畔?,因此有很多很好的工具來幫助他們完成諸如添加標(biāo)簽、梳理分析材料等工作。剛開始我感覺這些工具還不錯(cuò),但逐漸發(fā)現(xiàn)它們也有局限性,比如只能建立自己的信息系統(tǒng),卻不能與其他的數(shù)據(jù)庫或軟件連接起來。

后來有一天下午,我參加了一個(gè)關(guān)于給文本編碼的會(huì)議。我意識(shí)到如果既有的軟件沒有合適的,我完全可以自己嘗試做一些東西,而這些東西利用記事本軟件就可以完成。所以我就自己建立了一套程序來標(biāo)記王明清的《揮麈錄》。我首先找到一份《揮麈錄》的電子文本,然后開始思考關(guān)于這部書想知道些什么,又想追問些什么。那個(gè)時(shí)候我不僅對(duì)書中所記的內(nèi)容感興趣,也對(duì)王明清的人際網(wǎng)絡(luò)有興趣:他究竟在跟誰對(duì)話,讀過哪些書,又對(duì)哪些作者感興趣,他提到的人生活在哪里又有過怎樣的經(jīng)歷?后來我逐漸意識(shí)到,如果能將我在《揮麈錄》中的發(fā)現(xiàn)與CBDB(中國歷代人物傳記資料庫)鏈接起來的話,工作會(huì)更加容易、豐富,因?yàn)镃BDB已經(jīng)收錄了這些人的信息。當(dāng)然,自己去搜集這些人的信息也可以做到,但那要花費(fèi)大量的時(shí)間。利用CBDB中的人物ID,我可以將想找的人物與CBDB鏈接在一起,這樣就能從中獲取要分析的很多人物的相關(guān)信息,而在分析完成后還可以連接回原文。此外,CBDB還收錄有地點(diǎn)信息,利用這些就可以分析一部分人的地理分布;利用CBDB收錄的仕途信息,也可以了解跟王明清交游的人有哪些背景;利用CBDB收錄的時(shí)間信息,還可以知曉他究竟在讀什么時(shí)代的書,他是跟幾個(gè)世紀(jì)以前的古人對(duì)話,還是在跟同時(shí)代的人對(duì)話。因此,我可以做很多以前自己不容易做到的探索。過去我們認(rèn)為筆記只是在抄襲前人說過的話,利用筆記也多是在尋找人物的趣聞?shì)W事,但通過對(duì)筆記全書的梳理,就可以了解作者究竟在談?wù)撔┦裁?,他在跟誰對(duì)話,而那些人的背景又是怎樣的。

這是一次成功的探索,之后我又和一些研究生一起,利用這種方式做了更多的嘗試。以這些為基礎(chǔ),我申請(qǐng)了一個(gè)更大的項(xiàng)目。這個(gè)項(xiàng)目的初衷只是想在我們已經(jīng)標(biāo)記過的文本的基礎(chǔ)上,創(chuàng)建一個(gè)文本視覺化的平臺(tái)。利用這個(gè)平臺(tái)讀者可以閱讀文本,把相關(guān)人物投射到地圖中,并還原他們的人際交往。后來我們意識(shí)到其實(shí)可以做到更多,我的助手Brent Ho(何浩洋)就開始建立一個(gè)讓用戶自己標(biāo)記文本的平臺(tái)。

總結(jié)一下,我對(duì)數(shù)位人文的興趣,其實(shí)就是源于在閱讀文獻(xiàn)時(shí),想找到一種更好的做筆記的方法,同時(shí)也想在閱讀的同時(shí)能夠做出一些分析,從而可以從多角度審視正在處理的文獻(xiàn),不僅是要精讀文獻(xiàn),也能關(guān)注人的地理分布和相關(guān)背景。在這方面,我認(rèn)為利用數(shù)位方法能夠給研究者帶來一些幫助。

澎湃新聞您認(rèn)為數(shù)位人文對(duì)于目前歷史研究的意義有哪些?怎樣才能更好地將數(shù)位人文與歷史研究相結(jié)合?

魏希德:這也是一個(gè)很難回答的問題。我想從幾個(gè)角度談?wù)剶?shù)位人文能夠給歷史研究帶來什么。首先,正如我之前已經(jīng)提到的,研究者可以利用數(shù)位技術(shù)更好地發(fā)掘原始文獻(xiàn)。假設(shè)有研究者對(duì)某個(gè)具體問題感興趣,比如對(duì)兩浙地區(qū)的水利管理感興趣,應(yīng)該怎樣查找合適的文獻(xiàn)呢?也許有人說可以瀏覽所有的地方志材料,可以利用目錄學(xué)書籍,可以檢索《四庫全書》、《四部叢刊》或是“中國基本古籍庫”,這樣就能找到大量的相關(guān)記載。但要如何把這么多的材料統(tǒng)合起來呢?借助數(shù)位人文,如果我們能把它發(fā)展好的話,就可以利用盡可能多的材料。其實(shí),研究者應(yīng)該利用所有已經(jīng)被數(shù)字化的文獻(xiàn)。過去很長一段時(shí)間,人們都是更倚重某一類型的史料,但是以后就不必如此了,我們會(huì)利用所有的史料。接著,研究者需要從檢索到的大量結(jié)果中選取與水利管理相關(guān)的資料。檢索到的結(jié)果會(huì)包含某地點(diǎn)、某時(shí)間、某人物、或其它的關(guān)鍵詞。通過數(shù)位的方法,可以顯示出某一個(gè)地點(diǎn)被提到了多少次,并直接查到研究者最感興趣的某地點(diǎn)或時(shí)間的資料。因此,數(shù)位人文不僅能使研究者利用盡可能多的材料,還能提示研究者與研究主題最為相關(guān)的內(nèi)容。然而傳統(tǒng)的數(shù)據(jù)庫做不到這些,因此研究者需要自己考慮設(shè)計(jì)數(shù)位工具。

研究者還能借助數(shù)位人文進(jìn)行更加多元化的分析。獲得檢索結(jié)果之后,我們可以開始對(duì)其做出注釋。與傳統(tǒng)的從結(jié)果中擇取幾條進(jìn)行舉例論證的做法不同,數(shù)位人文可以幫助研究者對(duì)所有檢索到的材料進(jìn)行系統(tǒng)的分析。這只是研究過程的一部分,但研究者卻可以宏觀認(rèn)知發(fā)現(xiàn)了什么。我認(rèn)為這對(duì)歷史學(xué)家尤其重要。數(shù)位人文不僅可以幫助研究者判斷何者才是最適宜的史料,它還能給研究者提供更多的選擇去做更多樣的分析。這樣可以更加系統(tǒng)地反思所要研究問題的不同面相。

此外,借助數(shù)位人文,研究者還可以“放大”或“縮小”研究范圍。也許我對(duì)上百條的檢索結(jié)果并不感興趣,而只是對(duì)其中的某一個(gè)文本特別感興趣,因?yàn)檫@個(gè)文本詳細(xì)記述了這一地區(qū)水利管理的情況。但當(dāng)我要利用這個(gè)文本時(shí),可能并不知道怎樣將這個(gè)文本置于更大的背景之下。如果利用了上面提到的數(shù)位人文的研究方法(即已經(jīng)對(duì)史料有了宏觀把握、對(duì)問題有了系統(tǒng)反思),雖然我還是在處理某一份具體文本,但卻知道這個(gè)文本中的某些內(nèi)容可以與那個(gè)時(shí)期其它的文獻(xiàn)記載相聯(lián)系,這樣就將這份文本置于更大的背景之下。

最后一點(diǎn),借助數(shù)位人文,可以更好地分析研究結(jié)果,并與他人共享,這對(duì)歷史研究同樣非常重要。不僅要把結(jié)果共享,還要讓別人有條件去評(píng)估你的研究。以王明清為例,我可以將我的所有發(fā)現(xiàn)在網(wǎng)絡(luò)上共享,這樣別人就能利用我的發(fā)現(xiàn)。別人不僅能看到我的excel表格和所有原始數(shù)據(jù),還能看到我所利用的文本、做過的注釋以及結(jié)論等等。利用我共享的信息,他人也可以提出新的問題。

所以,研究者可以利用數(shù)位人文更充分地掌握更多的文獻(xiàn),而過去,這些文獻(xiàn)可能是根本看不完或處理不完的,在掌握更多文獻(xiàn)的基礎(chǔ)上,研究者極有可能發(fā)現(xiàn)新的問題。

那么,怎樣將數(shù)位人文與歷史研究相結(jié)合呢?我認(rèn)為我們現(xiàn)在需要數(shù)位人文的教育,需要數(shù)字史學(xué)的訓(xùn)練,因?yàn)榘ㄎ以趦?nèi)的一代人在求學(xué)期間并沒有接受過相關(guān)訓(xùn)練。所以當(dāng)需要教授學(xué)生相關(guān)知識(shí)時(shí),也許我們自己對(duì)它還沒有足夠了解。在我還是一名研究生的時(shí)候,曾驚訝于能用我們的系統(tǒng)處理漢字,這在當(dāng)時(shí)已經(jīng)是非常先進(jìn)的技術(shù)了,然而現(xiàn)在已經(jīng)不是那個(gè)時(shí)代了。我認(rèn)為我們現(xiàn)在正處于一個(gè)過渡時(shí)期,發(fā)展到最后,歷史還是歷史,人文還是人文,而數(shù)字化的方法則會(huì)被充分地吸納于其中。將來,我們會(huì)將數(shù)字化方法與其它的研究方法等量齊觀,這些方法之間也會(huì)互相融合。雖然我相信數(shù)字化與歷史學(xué)最終會(huì)融為一體,但現(xiàn)在還很難回答這件事會(huì)什么時(shí)候發(fā)生,又會(huì)以怎樣的方式發(fā)生?,F(xiàn)在我們依然需要學(xué)習(xí)相關(guān)知識(shí),也還要證明用數(shù)字化進(jìn)行歷史研究的正當(dāng)性。

澎湃新聞:Markus是您主持開發(fā)的數(shù)位人文研究新工具,能否介紹一下Markus的基本情況和相關(guān)功能,以及您對(duì)Markus的設(shè)計(jì)構(gòu)想?

Markus簡體中文版首頁

魏希德:最初設(shè)計(jì)Markus時(shí),我只想建立一個(gè)標(biāo)記平臺(tái)。正如之前已經(jīng)提到的,剛開始我是手動(dòng)完成標(biāo)記工作的。后來我們想到,既然已經(jīng)有了CBDB數(shù)據(jù)庫,有了一長串的歷史地名、時(shí)間坐標(biāo)和官名信息,為什么不去利用它們更好地發(fā)掘文本中所包含的此類信息呢?這樣就不必再手動(dòng)一個(gè)一個(gè)去標(biāo)記了。

此外,我們認(rèn)為能夠標(biāo)記出人名、地名、時(shí)間和官名固然已經(jīng)很好,但很多時(shí)候研究者還會(huì)對(duì)其它的信息感興趣,比如經(jīng)濟(jì)活動(dòng)、政治概念、藥物療效等。因此我們又開發(fā)了“關(guān)鍵詞標(biāo)記”功能。用戶既可以將感興趣的成百上千的關(guān)鍵詞一次性輸入并標(biāo)記,也可以使用正規(guī)表達(dá)式來標(biāo)記關(guān)鍵詞,比如標(biāo)記出每段的頭兩個(gè)字,或者標(biāo)記出特定的詞匯模組等。我們還開發(fā)了一個(gè)很有創(chuàng)意的功能,是由“國立臺(tái)灣大學(xué)”具體研發(fā)的,要讓文本自身提供關(guān)鍵詞:當(dāng)用戶在文本中標(biāo)記出一個(gè)關(guān)鍵詞后,利用這一功能可尋找文本中其它的與此關(guān)鍵詞用法一樣的詞匯。

為了完善Markus,我們決定更多地傾聽人文學(xué)者的意見。因此,我們舉辦了幾次工作坊,來了解人文學(xué)者到底想要哪些功能。我們逐漸意識(shí)到,人文學(xué)者固然對(duì)標(biāo)記或者分析很感興趣,但有時(shí)他們只是想閱讀文本。因此我們又提供了很多辭典和工具來輔助閱讀:有些是術(shù)語字典,有些是利用CBDB提供一個(gè)人的生平簡歷,有些則是在地圖上顯示某個(gè)地點(diǎn)的歷史變遷。另外,我們還提供了佛學(xué)辭典專門幫助用戶閱讀佛教典籍。在這些辭典和工具的幫助下,用戶可以流暢閱讀,并添加注釋。當(dāng)用戶想進(jìn)行翻譯時(shí),可以對(duì)文本進(jìn)行標(biāo)記并查閱辭典,然后將自己的翻譯添加在注釋中。當(dāng)無法在已有的辭典中找到答案時(shí),用戶可以在注釋中注明并將其保存在Markus系統(tǒng)中,然后回家查找手邊的其它辭典或去圖書館翻閱其它資料。所以從某種意義上來講,Markus也是一個(gè)閱讀平臺(tái),一個(gè)翻譯平臺(tái)。

我們還意識(shí)到自動(dòng)標(biāo)記出來的結(jié)果難免有錯(cuò)誤存在。盡管我們想節(jié)約研究者的時(shí)間和精力,使他們不必親力親為地做所有事情,但是沒有什么工具能做到真正的完美無瑕,其中必然有錯(cuò)誤存在。因此,研究者需要對(duì)標(biāo)記結(jié)果進(jìn)行評(píng)估,并改正其中的錯(cuò)誤。所以我們又開發(fā)了“手動(dòng)標(biāo)記”功能,使用戶能手動(dòng)修改錯(cuò)誤或添加新的標(biāo)記。我們還設(shè)計(jì)了“機(jī)器學(xué)習(xí)”功能,當(dāng)用戶手動(dòng)修改了一定數(shù)量的文本之后,系統(tǒng)就會(huì)學(xué)習(xí)修改的內(nèi)容,從而能夠自動(dòng)修正文本中的錯(cuò)誤。

雖然有很多人認(rèn)為Markus很有用,但在使用時(shí)還會(huì)遇到一些難題,比如在用Markus標(biāo)記分析完文本并把結(jié)果下載下來之后,要如何利用這些結(jié)果?通常來說,還需要借助其它軟件對(duì)結(jié)果做進(jìn)一步分析,比如創(chuàng)建地圖、進(jìn)行網(wǎng)絡(luò)分析或語匯頻率分析等。為了幫用戶把這最后一步的困難也解決掉,我們決定將Markus與其它已經(jīng)存在的能夠做視覺化分析的平臺(tái)鏈接起來。比如現(xiàn)在Markus已經(jīng)與Palladio鏈接了起來,用戶可以將Markus的標(biāo)記結(jié)果很方便地輸入到這個(gè)視覺化分析平臺(tái),所有的信息(包括CBDB的相關(guān)信息在內(nèi))都可以做進(jìn)一步的分析。除了Palladio,目前Markus還與其它一些全文數(shù)據(jù)庫(如ctext.org)、數(shù)據(jù)分析平臺(tái)鏈接了起來以方便用戶使用。

所以在我看來,Markus既是一個(gè)很好的文本分析與閱讀平臺(tái),同時(shí)也允許用戶將數(shù)據(jù)下載,使他們能用更先進(jìn)的軟件做更深入的分析。正如之前所說,我們?cè)谠O(shè)計(jì)完善Markus時(shí)會(huì)充分考慮研究者的興趣所在。因此,現(xiàn)在還有更多的功能正在開發(fā)。比如文本比對(duì)功能,因?yàn)闅v史學(xué)者和文獻(xiàn)學(xué)者往往都喜歡比對(duì)不同的版本來看不同時(shí)代間的文本變遷或文本之間的關(guān)系。我們還想進(jìn)一步完善機(jī)器學(xué)習(xí)功能、方便用戶更好地共享、發(fā)展其它東亞語言的標(biāo)記功能、添加更多的在線辭典等等。我們希望不斷完善這個(gè)平臺(tái)來更好地幫助數(shù)位人文學(xué)者。

澎湃新聞去年七月份萊頓大學(xué)召開了名為“東亞研究的數(shù)位探索:語料庫、方法與挑戰(zhàn)”的數(shù)位人文國際會(huì)議,會(huì)上很多學(xué)者都在研究中使用到了Markus,您認(rèn)為Markus能夠給學(xué)術(shù)研究帶來怎樣的突破?

萊頓大學(xué)“東亞研究的數(shù)位探索:語料庫、方法與挑戰(zhàn)”數(shù)位人文國際會(huì)議宣傳海報(bào)

魏希德:說實(shí)話,很開心看到有這么多學(xué)者在使用Markus,這是我之前從來沒有設(shè)想過的。到目前為止,Markus的開發(fā)大概只有兩年多的時(shí)間,并不算太長,但已經(jīng)有很多學(xué)科的學(xué)者在使用Markus,其中一部分學(xué)者就參加了去年的會(huì)議。去年三月,我做一個(gè)關(guān)于筆記所反映的社會(huì)網(wǎng)絡(luò)的講座,發(fā)現(xiàn)不僅歷史學(xué)者對(duì)Markus感興趣,從事文學(xué)研究、宗教研究、藝術(shù)史研究的學(xué)者也都想使用它。所以我們不斷完善Markus的另一個(gè)原因在于我們認(rèn)為歷史學(xué)之外的其它學(xué)科也能利用這一平臺(tái),我們也想根據(jù)他們的需求做一些改進(jìn)。在Markus網(wǎng)站的論壇上也能找到一些學(xué)者使用Markus實(shí)例,他們?cè)谄渲薪忉屃藶槭裁磿?huì)對(duì)Markus感興趣,以及如何利用它。

就我個(gè)人而言,在所有的會(huì)議論文中,Margaret Wan提交的那篇關(guān)于明清文學(xué)的論文是最有吸引力的。目前已經(jīng)有很多學(xué)者對(duì)不同類型的小說,比如武俠小說等,做過研究,Margaret Wan也把這些小說讀過很多遍,并做了一些研究。但是她想嘗試一下如果用Markus將小說中所有的地名都標(biāo)記出來會(huì)有什么發(fā)現(xiàn)。結(jié)果她發(fā)現(xiàn),盡管已經(jīng)閱讀這些小說很長時(shí)間了,但對(duì)于Markus標(biāo)記分析出的一些地點(diǎn),她卻從來沒有關(guān)注過。這是因?yàn)樵陂喿x時(shí)她通常只在關(guān)注她感興趣的問題,因而大量的背景性知識(shí)卻被遺漏了。比如一本小說描繪了偏遠(yuǎn)地區(qū)發(fā)生的一些事情,學(xué)者在研究時(shí)往往就會(huì)忽略小說中首都的意義,因?yàn)榇蟛糠值那楣?jié),比如反抗等等,都發(fā)生在這個(gè)偏遠(yuǎn)地區(qū),因此首都就很難引起他們的注意。但事實(shí)上,首都是極為重要的,當(dāng)你分析完所有的地方就會(huì)發(fā)現(xiàn),首都和偏遠(yuǎn)地區(qū)形成了一種永恒的張力。因此,研究者需要對(duì)經(jīng)常被忽略的所謂的“噪音”給予足夠關(guān)注,這些“噪音”往往對(duì)于理解這部小說和過去小說讀者的閱讀心理非常重要。這個(gè)例子提示我們,電腦在處理數(shù)據(jù)時(shí)可沒有什么優(yōu)先級(jí),它就是處理文本中出現(xiàn)的所有數(shù)據(jù),因此研究者可能會(huì)獲得新的視角,對(duì)文本產(chǎn)生新的理解。

其它領(lǐng)域的學(xué)者也在使用Markus做類似的事情。比如有一位做醫(yī)療史的學(xué)者對(duì)藥物很感興趣,他想對(duì)《本草綱目》做出分析。借助Markus,可以很容易就建造一個(gè)關(guān)于藥物療效的數(shù)據(jù)庫。過去當(dāng)然也可以做這項(xiàng)工作,但需要自己手動(dòng)分析大量條目,可現(xiàn)在只需將文本上傳至Markus就可以創(chuàng)建數(shù)據(jù)庫了,這是一種全新的處理文本的方式。

再舉一個(gè)藝術(shù)史的例子。有些學(xué)者對(duì)收藏史很感興趣,她們關(guān)注哪些人收藏了哪些藝術(shù)品,以及收藏者之間的關(guān)系是怎樣的。在用Markus將一份收藏目錄標(biāo)記完成后,所有的相關(guān)信息就會(huì)生成為一個(gè)數(shù)據(jù)庫。之后還可以再用CBDB檢視收藏者之間是否還有其它的聯(lián)系。Markus當(dāng)然不是完美的,它只是想幫助研究者更好地處理文本,其間難免會(huì)有錯(cuò)誤產(chǎn)生,需要用戶再去評(píng)估或改正。但是它能使研究者以自己現(xiàn)有文本為基礎(chǔ)來創(chuàng)建數(shù)據(jù)庫的愿望變得可行。而在這次會(huì)議上,讓我感到欣喜的不僅是看到學(xué)者們認(rèn)可Markus的價(jià)值,還在于它能夠幫助實(shí)現(xiàn)不同學(xué)科間的對(duì)話,使各個(gè)領(lǐng)域的人文學(xué)者共聚一堂。

澎湃新聞由于國內(nèi)、國外學(xué)術(shù)研究的取徑并不完全相同,您認(rèn)為Markus能夠給中國大陸學(xué)者帶來哪些幫助?

魏希德:這是一個(gè)很好的問題。其實(shí)Markus只是一個(gè)通過處理文本來創(chuàng)建數(shù)據(jù)庫的工具,此外也可以做一些分析工作,因此,不管是哪國的學(xué)者,只要想用這種方式進(jìn)行研究,Markus都是有幫助的。所以,Markus的益處應(yīng)該是沒有地區(qū)限制的。

但Markus確實(shí)有可能更受某些地區(qū)學(xué)者的青睞,因?yàn)镸arkus目前主要用于處理繁體字文本。如果用戶只有簡體字文本,就不能使用其中的一部分功能,這在一定程度上是因?yàn)镃BDB數(shù)據(jù)庫就是繁體字的。當(dāng)然,如果用戶想使用“關(guān)鍵詞標(biāo)記”功能,簡體字文本是完全沒有問題的。此外,我們提供的線上辭典也可能更受某一些研究群體的青睞,因此,不同背景的學(xué)者可能會(huì)對(duì)Markus有不同的用法。當(dāng)然,還有一個(gè)很現(xiàn)實(shí)的問題,就是Markus網(wǎng)站現(xiàn)在必須使用Google Chrome瀏覽器才能處理數(shù)據(jù),這是因?yàn)樵摓g覽器的處理能力是目前來看最高的。

其實(shí),對(duì)Markus的態(tài)度取決于研究者喜歡用什么樣的方式從事研究。不論歷史學(xué)家還是文獻(xiàn)學(xué)家,其實(shí)都在處理文本。如果想使自己的筆記更加系統(tǒng),或者想用圖像呈現(xiàn)文本的內(nèi)容,那么Markus就可能有用。研究者當(dāng)然也可以繼續(xù)利用傳統(tǒng)的方法進(jìn)行研究:這些研究方法之間并不一定互相矛盾。

Markus網(wǎng)站的論壇

澎湃新聞您認(rèn)為您所從事的數(shù)位人文研究與大陸學(xué)者和臺(tái)灣學(xué)者的數(shù)位人文研究有何不同?

魏希德:因?yàn)閿?shù)位人文是一個(gè)方興未艾的領(lǐng)域,因此我認(rèn)為很有必要去了解它在中國大陸、臺(tái)灣及日本、韓國等不同地區(qū)的發(fā)展情況,這也是我們?cè)谌ツ昶咴路菖e辦那次會(huì)議的一個(gè)原因。近來,雖然已經(jīng)有學(xué)者撰文描述數(shù)位人文在大陸和臺(tái)灣的發(fā)展?fàn)顩r,但到目前為止,我對(duì)相關(guān)情況的認(rèn)識(shí)還不夠清晰。

根據(jù)我有限的了解,總的來看,中國大陸在過去20-30年投入了大量資金用于文獻(xiàn)的數(shù)字化。大量古籍被進(jìn)行了掃描和OCR處理,建立了許多全文數(shù)據(jù)庫。這是一個(gè)巨大的成就,與其它語言相比,中文已經(jīng)有了很多的數(shù)字化文獻(xiàn)。但從另一個(gè)角度看,這些工作很多是在商業(yè)化驅(qū)使下完成的。很多項(xiàng)目是由商業(yè)公司負(fù)責(zé),因此價(jià)格不菲。很多學(xué)者對(duì)此持批評(píng)態(tài)度,認(rèn)為他們收了很多錢,卻沒有把數(shù)據(jù)庫做得更加實(shí)用,很多數(shù)據(jù)庫只是把諸多文獻(xiàn)集中到了一起而已。香港、臺(tái)灣也有類似的情況存在。

現(xiàn)在我們面臨的一個(gè)難題是中文的分詞問題,尤其是古代漢語詞匯的切分。在西方,很少有人關(guān)注這一問題,這也是西方和中國的一個(gè)不同,西方的數(shù)位人文往往更重視歐洲語言,尤其是英語。不過,我認(rèn)為大陸和臺(tái)灣一定程度上也有類似的問題,他們使用的很多工具最初是專為英語而設(shè)計(jì)的。而且他們似乎更關(guān)注現(xiàn)代漢語,對(duì)古代漢語的重視程度還明顯不夠。雖然中國現(xiàn)在已經(jīng)有了全文數(shù)據(jù)庫,但是數(shù)位工具的開發(fā)仍任重而道遠(yuǎn)。在大陸,數(shù)位人文還沒有得到足夠的重視,很多大學(xué),如武漢大學(xué)、北京大學(xué)等,也尚處于起步探索階段,目前并沒有可觀的成果涌現(xiàn),所以我很難比較其間的異同。

我更期盼深化國際間的合作,目前存在的不同也許恰恰能成為合作分工的基礎(chǔ)?,F(xiàn)在已經(jīng)有越來越多的國際合作項(xiàng)目,比如中國歷史地理信息系統(tǒng)、CBDB數(shù)據(jù)庫等等。臺(tái)灣地區(qū)也有很多的國際合作項(xiàng)目,Markus就有一個(gè)功能模塊是由“國立臺(tái)灣大學(xué)”的項(xiàng)潔教授完成的,教學(xué)方面我們也跟新竹“清華大學(xué)”的祝平次有合作。

澎湃新聞最后能否簡單談?wù)勀鷮?duì)數(shù)位人文發(fā)展前景的預(yù)估和期待?怎樣才能更好地推進(jìn)數(shù)位人文研究的進(jìn)步?

魏希德:我認(rèn)為將來應(yīng)該嘗試多種形式的教學(xué),這是一件很急迫的事情,我們應(yīng)該讓學(xué)生準(zhǔn)確地認(rèn)識(shí)到什么是數(shù)位人文、如何利用數(shù)位人文開展研究以及數(shù)位人文能夠解決哪些問題。我注意到,我的同事和學(xué)生們普遍對(duì)數(shù)位人文期待過高,他們認(rèn)為問題能夠自動(dòng)解決,但這是不可能的。所以人們的期望必須建立在充分了解數(shù)位是什么、程序如何運(yùn)行等問題的基礎(chǔ)上。另外一個(gè)問題是,使用數(shù)位人文有時(shí)也會(huì)得出錯(cuò)誤的結(jié)論,這很大程度是因?yàn)橛行┤丝吹綀D表、社會(huì)網(wǎng)絡(luò)圖或地圖就做出結(jié)論,他們?cè)趯?duì)待這些圖像時(shí)往往不能像對(duì)待文本那樣具有批判性的眼光。這一訓(xùn)練尚有待加強(qiáng),在看到處理結(jié)果后要多問問題,不能一下子就得出結(jié)論。研究者需要細(xì)心對(duì)待正在處理的數(shù)據(jù),看它們是統(tǒng)計(jì)性的數(shù)據(jù)、錯(cuò)誤的亂碼還是其它。其實(shí)現(xiàn)在網(wǎng)上有很多的模塊組件,當(dāng)學(xué)生想了解空間數(shù)據(jù)的使用或如何利用地圖呈現(xiàn)研究時(shí),就可以利用這些線上資源來獲得基本的認(rèn)知。此外,研究者應(yīng)該努力避免簡單幼稚地使用數(shù)位手段,因?yàn)橛袝r(shí)這一手段可能并不適用于某些研究內(nèi)容。

總之,我們應(yīng)該努力對(duì)學(xué)生進(jìn)行數(shù)字化“掃盲”,使他們了解程序運(yùn)作背后的思維邏輯。使用數(shù)位人文并不意味著事事都要用它的思維去思考,研究者更應(yīng)該有能力對(duì)數(shù)位人文做出評(píng)估,要能去判斷我們可以利用數(shù)位人文做些什么,又有哪些不能企及。能夠做出正確的評(píng)估是很重要的,因?yàn)槲覀児倘灰獙?duì)數(shù)位人文保持批判精神,但有些批判完全是出于誤解。我的期望是將來所有人文學(xué)科的學(xué)生都能意識(shí)到研究方法是豐富多樣的,而數(shù)位方法也是其中之一。其實(shí),任何研究方法的背后都有理論思考,因此需要了解每種方法論背后的理論假設(shè)是什么,這些假設(shè)會(huì)影響方法的適用范圍,也會(huì)讓我們更好地理解這種方法。因此,對(duì)學(xué)生進(jìn)行數(shù)字化“掃盲”,對(duì)于將來數(shù)位人文的發(fā)展非常重要,現(xiàn)在在萊頓大學(xué),就已經(jīng)在人文學(xué)院設(shè)立了“數(shù)位人文”的副修專業(yè),希望使學(xué)生更好地了解數(shù)字本身、數(shù)字媒體、與數(shù)字研究。

(注:本文系筆者據(jù)魏希德教授的英文訪談錄音翻譯整理而成,雖全文已經(jīng)本人審閱,但轉(zhuǎn)譯之中難免有疏漏歧義之處,敬祈讀者見諒。)

    校對(duì):張艷
    澎湃新聞報(bào)料:021-962866
    澎湃新聞,未經(jīng)授權(quán)不得轉(zhuǎn)載
            查看更多

            掃碼下載澎湃新聞客戶端

            滬ICP備14003370號(hào)

            滬公網(wǎng)安備31010602000299號(hào)

            互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006

            增值電信業(yè)務(wù)經(jīng)營許可證:滬B2-2017116

            ? 2014-2026 上海東方報(bào)業(yè)有限公司