政大機構典藏-National Chengchi University Institutional Repository(NCCUR):Item 140.119/123574
English  |  正體中文  |  简体中文  |  Post-Print筆數 : 27 |  全文笔数/总笔数 : 113318/144297 (79%)
造访人次 : 51105139      在线人数 : 936
RC Version 6.0 © Powered By DSPACE, MIT. Enhanced by NTU Library IR team.
搜寻范围 查询小技巧:
  • 您可在西文检索词汇前后加上"双引号",以获取较精准的检索结果
  • 若欲以作者姓名搜寻,建议至进阶搜寻限定作者字段,可获得较完整数据
  • 进阶搜寻


    请使用永久网址来引用或连结此文件: https://nccur.lib.nccu.edu.tw/handle/140.119/123574


    题名: 臺灣歷史人物文本檢索與探勘系統之建置
    Development of a Text Retrieval and Mining System for Taiwanese Historical People
    作者: 謝順宏
    Sie, Shun-Hong
    柯皓仁
    Ke, Hao-Ren
    張素玢
    Chang, Su-bing
    贡献者: 圖資與檔案學刊
    关键词: 臺灣歷史人物資料庫;文本檢索;文本探勘;社會網絡分析;命名實體辨識
    Taiwan Biographical Database (TBDB);Text retrieval;Text mining;Social network analysis (SNA);Name entity recognition
    日期: 2018-06
    上传时间: 2019-05-23 10:05:02 (UTC+8)
    摘要: 「人物」是歷史學研究重要的實體類型之一,因此,對人物傳記的深入了解有助於歷史事件的相關研究。目前許多人物傳記資料是以數位文件的形式存在,而要以人力從大量人物傳記中爬梳、彙整資料頗為曠日廢時,宜妥為運用資訊科技協助歷史學家。此外,儘管臺灣過去已建置眾多資料庫,也有各種人物傳和可資應用的資料文獻,卻較少進行歷史人物資料庫勘考、分析工具的開發。有鑑於此,研究者乃組成研究團隊,以《新修彰化縣志‧人物志》為文本來源,發展資料庫檢索、全文檢索、文本探勘與社會網絡等分析工具,協助歷史人文學進行研究,長期目標為建置「臺灣歷史人物資料庫(Taiwan Biographical Database, TBDB)」。本研究主旨在於描述「臺灣歷史人物資料庫」現階段所收錄之人物特性,闡述系統架構,以及說明初步成果。此外,本研究將提出一套演算法辨識《新修彰化縣志‧人物志》中的命名實體(named entity),並以詩社名稱辨識為例說明。該套演算法的召回率達96%,精確率則為65%。最後,本研究將說明建置「臺灣歷史人物資料庫」過程中習得之經驗和未來發展方向。
    Personage is an important kind of entities in the study of history. Comprehensive understanding of personage biographies is beneficial for researching into historical events. In the digital era, many personage biographies are available in digital formats; as a result, it is time-consuming and labor-intensive for researchers to explore invaluable findings from massive personage biographies. Facing this situation, researchers may be helped to utilize the information efficiently with information technologies. This article introduces the development of a text retrieval and mining system for Taiwanese historical people -- Taiwan Biographical Database (TBDB). It describes the characteristics of personages in TBDB, highlights the system architecture and preliminary achievement of TBDB, and proposes a method to recognize named entities in the personage biographies, specifically poetry societies, which achieves the recall rate of 96% and the precision rate of 65%. Finally, this article elaborates on the lessons learned through the creation of TBDB, and the future plans.
    關聯: 圖資與檔案學刊, 92, 67-87
    数据类型: article
    DOI 連結: https://doi.org/10.6575/JILA.201806_(92).0004
    DOI: 10.6575/JILA.201806_(92).0004
    显示于类别:[圖資與檔案學刊] 期刊論文

    文件中的档案:

    档案 描述 大小格式浏览次数
    5.pdf2224KbAdobe PDF2329检视/开启


    在政大典藏中所有的数据项都受到原著作权保护.


    社群 sharing

    著作權政策宣告 Copyright Announcement
    1.本網站之數位內容為國立政治大學所收錄之機構典藏,無償提供學術研究與公眾教育等公益性使用,惟仍請適度,合理使用本網站之內容,以尊重著作權人之權益。商業上之利用,則請先取得著作權人之授權。
    The digital content of this website is part of National Chengchi University Institutional Repository. It provides free access to academic research and public education for non-commercial use. Please utilize it in a proper and reasonable manner and respect the rights of copyright owners. For commercial use, please obtain authorization from the copyright owner in advance.

    2.本網站之製作,已盡力防止侵害著作權人之權益,如仍發現本網站之數位內容有侵害著作權人權益情事者,請權利人通知本網站維護人員(nccur@nccu.edu.tw),維護人員將立即採取移除該數位著作等補救措施。
    NCCU Institutional Repository is made to protect the interests of copyright owners. If you believe that any material on the website infringes copyright, please contact our staff(nccur@nccu.edu.tw). We will remove the work from the repository and investigate your claim.
    DSpace Software Copyright © 2002-2004  MIT &  Hewlett-Packard  /   Enhanced by   NTU Library IR team Copyright ©   - 回馈