政大機構典藏-National Chengchi University Institutional Repository(NCCUR):Item 140.119/111783
English  |  正體中文  |  简体中文  |  Post-Print筆數 : 27 |  全文筆數/總筆數 : 113822/144841 (79%)
造訪人次 : 51798345      線上人數 : 505
RC Version 6.0 © Powered By DSPACE, MIT. Enhanced by NTU Library IR team.
搜尋範圍 查詢小技巧:
  • 您可在西文檢索詞彙前後加上"雙引號",以獲取較精準的檢索結果
  • 若欲以作者姓名搜尋,建議至進階搜尋限定作者欄位,可獲得較完整資料
  • 進階搜尋
    政大機構典藏 > 資訊學院 > 資訊科學系 > 學位論文 >  Item 140.119/111783
    請使用永久網址來引用或連結此文件: https://nccur.lib.nccu.edu.tw/handle/140.119/111783


    題名: 中國古典詩歌對應探勘及詞彙分析工具
    Tools for Pattern Comparison and Word Analysis of Chinese Classical Poetry
    作者: 黃植琨
    貢獻者: 劉昭麟
    黃植琨
    關鍵詞: 數位人文
    文本探勘
    詩歌
    Digital humanities
    Text mining
    Poem
    日期: 2017
    上傳時間: 2017-08-10 09:58:11 (UTC+8)
    摘要: 本研究以《詩經》、《楚辭》、《全唐詩》、《全宋詩》及《全宋詞》等,數位化的文本資料作為基礎,運用資訊技術,建構分析文獻間借鑒的工具。工具採用字串或詞彙比對的方式,使用者可以透過設定,過濾出可能的對應關係,特別是《全唐詩》、《全宋詩》和《全宋詞》間字面上的類似之處。本研究參考人文領域的研究,用以評估工具的效果。同時,我們也藉由資訊科學的角度,統計如唐詩和宋代詩詞間的對應關係,亦透過如《詩經》和《詩經》、《楚辭》和《楚辭》、《全唐詩》和《全唐詩》、《全宋詞》和《全宋詞》、《全宋詩》和《全宋詩》的對應關係,挖掘同一時代文人作品的對應。另外,本研究也嘗試中國古典詩歌的斷詞,以及分析詩歌中詞彙的語意,未來也希望能夠透過語意進行詩歌比對。本研究雖不如傳統方法的人文研究深入,但提供從大量的語料中去蕪存菁,以及統計等相關服務,節省人文研究分析整理文本所需的時間,用數位的力量輔助人文領域的相關研究。
    參考文獻: [1]Bol, Peter K. (2016). The Humanities and the Digital Humanities in Higher Education, Proceedings of the 2016 International Conference on Digital Humanities, 5‒11.
    [2]Bouma, Gerlof (2009). Normalized (pointwise) mutual information in collocation extraction, Proceedings of German Society for Computational Linguistics and Language Technology Conference, 31‒40.
    [3]Chen, Chien-Liang, Liu, Chao-Lin, Chang, Yuan-Chen, and Tsai, Hsiang-Ping (2011). Exploring the relationships between annual earnings and subjective expressions in US financial statements, Proceedings of the 8th IEEE International Conference on e-Business Engineering, 1‒8.
    [4]Gerard, Salton, Wong, Anita, and Yang, Chung-Shu (1975). A vector space model for automatic indexing, Communications of the ACM, 18(11), 613‒620.
    [5]Hall, Patrick A.V. and Dowling, Geoff R. (1980). Approximate string matching, ACM Computing Surveys, 12(4), 381‒403.
    [6]Huang, Chu-Ren, Lo, Feng-ju, Chang, Ru-Yng, and Chang, Sueming (2004). Sinica BOW and 300 Tang poems: An overview of a bilingual ontological wordnet and its application to a small ontology of Tang poetry, presented at the Workshop on Possibilities of a Knowledgebase of Tang Civilization, Institute for Research in Humanities.
    [7]Kaplan, David M. and Blei, David M. (2007). A computational approach to style in American poetry, Proceedings of the 7th IEEE International Conference on Data Mining, 553‒558.
    [8]Le, Quoc and Mikolov, Tomas (2014). Distributed representations of sentences and documents, Proceedings of the 31st International Conference on Machine Learning, 1188‒1196.
    [9]Liu, Chao-Lin (2016). Quantitative analyses of Chinese poetry of Tang and Song dynasties: Using changing colors and innovative terms as examples, Proceedings of the 2016 International Conference on Digital Humanities, 260‒262.
    [10]Liu, Chao-Lin, Jin, Guantao, Liu, Qingfeng, Chiu, Wei-Yun, and Yu, Yih-Soong (2011). Some chances and challenges in applying language technologies to historical studies in Chinese, Proceedings of the Association for Computational Linguistics and Chinese Language, 27‒46.
    [11]Liu, Chao-Lin, Wang, Hongsu, Hsu, Chu-Ting, Cheng, Wen-Huei, and Chiu, Wei-Yun (2015). Color aesthetics and social networks in complete Tang poems: Explorations and discoveries, Proceedings of the 29th Pacific Asia Conference on Language, Information and Computation, 132‒141.
    [12]Liu, Chao-Lin and Luo, Kuo-Feng (2016). Tracking words in Chinese poetry of Tang and Song dynasties with the China biographical database, Proceedings of the Workshop on Language Technology Resources and Tools for Digital Humanities, The 26th International Conference on Computational Linguistics, 172‒180.
    [13]Manning, Christopher D. and Schütze, Hinrich (2009). Boolean retrieval, Introduction to Information Retrieval, 1‒18, Cambridge University Press.
    [14]Manning, Christopher D. and Schütze, Hinrich (1999). Rationalist and empiricist approaches to language, Foundations of Statistical Natural Language Processing, 4-7, MIT press.
    [15]Niles, Ian and Pease, Adam (2003). Linking lexicons and ontologies: mapping WordNet to the suggested upper merged ontology, Proceedings of the IEEE International Conference on Information and Knowledge Engineering, 412‒416.
    [16]Schich, Maximilian, Song, Chaoming, Ahn, Yong-Yeol, Mirsky, Alexander, Martino, Mauro, Barabási, Albert-László, and Helbing, Dirk (2014). A network framework of cultural history, Science, 345(6196), 558‒562.
    [17]Wang, Xiaoguang and Inaba, Mitsuyuki (2009). Analyzing structures and evolution of digital humanities based on correspondence analysis and co-word analysis, Art Research, 123‒134.
    [18]Waterman, Michael S. and Smith, Temple F. (1981). Identification of common molecular subsequences, Journal of Molecular Biology, 147(1), 195‒197.
    [19]Yong, Yi, He, Zhong-Shi, Li, Liang-Yan, Yu, Tian, and Yi, Elaine (2005). Advanced studies on traditional Chinese poetry style identification, Proceedings of the 2005 IEEE International Conference on Machine Learning and Cybernetics, 6, 3830‒3833.
    [20]王兆鵬 (2005)。《古今詞統》誤收誤題唐五代詞考辨。唐宋詞史的還原與建構,267‒281,湖北人民出版社。
    [21]王廼仁 (2006)。唐詩之詩風探勘。國立交通大學理學院網路學習學程碩士論文。
    [22]王偉勇 (2003)。賀鑄《東山詞》借鑒唐詩之探析──兩宋詞人借鑒唐詩之奇葩。宋詞與唐詩之對應研究,187‒311,文史哲出版社。
    [23]朱自力 (1995)。周邦彥融詩入詞之特色。中華學苑,45,305-317。
    [24]吳丈蜀 (2000)。詞的起源。詞學概說,1‒15,中華書局。
    [25]吳榮富 (2002)。李商隱詩用典析疑。國立成功大學中國文學系博士論文。
    [26]李威延 (2008)。以詩詞本體論與類神經網路為基礎之唐詩推薦系統。國立中央大學資訊工程所碩士論文,2008。
    [27]李劍亮 (1999)。詞為歌妓應歌而作。唐宋詞與唐宋歌妓制度, 92‒134,杭州大學出版社。
    [28]林書佑(2016)。中文文本探勘工具:主題分析、詞組關聯強度、相關句擷取。國立政治大學資訊科學系碩士論文。
    [29]金觀濤、邱偉雲及劉昭麟 (2012)。「共現」詞頻分析及其運用──以「華人」觀念起源為例。數位人文要義:尋找類型與軌跡,141‒170,國立臺灣大學出版中心。
    [30]俞士汶及胡俊峰 (2003)。唐宋詩之詞匯自動分析及應用。語言暨語言學,4(3),631‒647。
    [31]孫琴安(2003)。詩歌是唐代君臣郊遊和政治生活中的一個重要內容。唐詩與政治,18‒31,上海人民出版社,2003。
    [32]高旖璐(2009)。《全唐詩》中「禽鳥入詩」之硏究。國立彰化師範大學國文研究所博士論文。
    [33]許嘉妮(2007)。詞風與情境判斷專家系統。國立交通大學資訊學院資訊學程碩士論文。
    [34]許薰尹(2006)。宋詞斷詞與本體論之建置。國立交通大學理學院科技與數位學習學程碩士論文。
    [35]陳金現(2010)。宋詩的「互文性」概念。宋詩與白居易的互文性研究,27‒45,文津出版社有限公司。
    [36]彭維謙、劉士綱、杜協昌、翁稷安及項潔(2014)。自動擷取中文典籍中人名之嘗試:以 PMI(pointwise mutual information)斷詞於《資治通鑑》的應用為例。數位人文研究與技藝,139‒163,國立臺灣大學出版中心。
    [37]項潔(2015)。電子文獻的再脈絡化。第六屆數位典藏與數位人文國際研討會論文集,15‒16。
    [38]項潔及翁稷安(2012)。多重脈絡—數位檔案之問題與挑戰。數位人文要義:尋找類型與軌跡,25‒59,國立臺灣大學出版中心。
    [39]項潔及塗豐恩(2011)。導論―什麼是數位人文。從保存到創造:開啟數位人文研究,9‒28,國立臺灣大學出版中心。
    [40]楊哲青、蘇俊銘、曾憲雄及羅鳳珠(2004)。詩作風格知識庫之研究-以蘇軾近體詩為例。語言,文學與資訊,263‒295。
    [41]裴普賢(1977)。集句詩研究續集。書目季刊,11(2),25‒72。
    [42]劉岩斌、俞士汶及孫欽善 (1997)。古詩詞研究的電腦支援環境的實現。中文資訊學報,11(1),21‒36。
    [43]劉昭麟、金觀濤、劉青峰、邱偉雲及姚育松(2012)。自然語言處理技術於中文史學文獻分析之初步應用。數位人文要義:尋找類型與軌跡,61‒82,國立臺灣大學出版中心。
    [44]劉昭麟、張淳甯、許築婷、鄭文惠、王宏甦及邱偉雲(2015)。《全唐詩》的分析、探勘與應用-風格、對仗、社會網路與對聯。第廿七屆自然語言與語音處理研討會論文集,43‒57。
    [45]劉錚雲(2015)。我們如何建全文資料庫:中研院史語所漢籍電子文獻資料庫的回顧與展望。第六屆數位典藏與數位人文國際研討會論文集,11‒12。
    [46]蔣紹愚(2003)。李白杜甫詩中的"月"和"風"-電腦如何用於古典詩詞鑒賞。第一屆文學與資訊科技國際會議論文集。
    [47]蔣紹愚(2008)。唐詩的句法。唐詩語言研究,161‒236,語文出版社。
    [48]鄭永曉(2012)。情感計算應用於古典詩詞研究芻議。科研資訊化技術與應用,3(4),59‒66。
    [49]龍榆生(1978)。唐宋詞格律,上海古籍出版社。 2017年2月15日,取自http://longyusheng.org/cipai/。
    [50]穗志方、俞士汶及羅鳳珠(1998)。宋代名家詩選自動注音研究及系統實現。中文資訊學報,12(2),44‒53。
    [51]謝銘洋(2014)。我國著作權法中「創作」概念相關判決之研究。國際比較下我國著作權法之總檢討,57‒89,中央研究院法律學研究所出版。
    [52]鍾嘉軒(2013)。類書知識分類變化之自動分析與討論以《藝文類聚》與《太平御覽》為例。國立台灣大學資訊工程所碩士論文。
    [53]羅鳳珠(2011)。以語言知識庫爲基礎的智慧型作詩填詞輔助系統。教學科技與媒體, 95,35‒42。
    [54]羅鳳珠 (2005)。詩詞語言詞彙切分與語意分類標記之系統設計與應用。第四屆數位典藏技術研討會論文集。
    [55]羅鳳珠、李元萍及曹偉政(1999)。中國古代詩詞格律自動檢索與教學系統。中文資訊學報,12(1),35‒42。
    描述: 碩士
    國立政治大學
    資訊科學學系
    101753034
    資料來源: http://thesis.lib.nccu.edu.tw/record/#G0101753034
    資料類型: thesis
    顯示於類別:[資訊科學系] 學位論文

    文件中的檔案:

    檔案 大小格式瀏覽次數
    303401.pdf2245KbAdobe PDF2956檢視/開啟


    在政大典藏中所有的資料項目都受到原著作權保護.


    社群 sharing

    著作權政策宣告 Copyright Announcement
    1.本網站之數位內容為國立政治大學所收錄之機構典藏,無償提供學術研究與公眾教育等公益性使用,惟仍請適度,合理使用本網站之內容,以尊重著作權人之權益。商業上之利用,則請先取得著作權人之授權。
    The digital content of this website is part of National Chengchi University Institutional Repository. It provides free access to academic research and public education for non-commercial use. Please utilize it in a proper and reasonable manner and respect the rights of copyright owners. For commercial use, please obtain authorization from the copyright owner in advance.

    2.本網站之製作,已盡力防止侵害著作權人之權益,如仍發現本網站之數位內容有侵害著作權人權益情事者,請權利人通知本網站維護人員(nccur@nccu.edu.tw),維護人員將立即採取移除該數位著作等補救措施。
    NCCU Institutional Repository is made to protect the interests of copyright owners. If you believe that any material on the website infringes copyright, please contact our staff(nccur@nccu.edu.tw). We will remove the work from the repository and investigate your claim.
    DSpace Software Copyright © 2002-2004  MIT &  Hewlett-Packard  /   Enhanced by   NTU Library IR team Copyright ©   - 回饋