政大機構典藏-National Chengchi University Institutional Repository(NCCUR):Item 140.119/60215
English  |  正體中文  |  简体中文  |  Post-Print筆數 : 27 |  Items with full text/Total items : 113324/144300 (79%)
Visitors : 51144806      Online Users : 865
RC Version 6.0 © Powered By DSPACE, MIT. Enhanced by NTU Library IR team.
Scope Tips:
  • please add "double quotation mark" for query phrases to get precise results
  • please goto advance search for comprehansive author search
  • Adv. Search
    HomeLoginUploadHelpAboutAdminister Goto mobile version
    政大典藏 > College of Commerce > Department of MIS > Theses >  Item 140.119/60215
    Please use this identifier to cite or link to this item: https://nccur.lib.nccu.edu.tw/handle/140.119/60215


    Title: 應用文字探勘技術於臺灣上市公司重大訊息對股價影響之研究
    The study on impact of material information of public listed company to its stock price by using text mining approach
    Authors: 吳漢瑞
    Wu, Han Ruei
    Contributors: 楊建民
    吳漢瑞
    Wu, Han Ruei
    Keywords: 重大訊息
    文字探勘
    kNN演算法
    Material Information
    Text Mining
    kNN Algorithm
    Date: 2009
    Issue Date: 2013-09-04 16:59:03 (UTC+8)
    Abstract: 台灣股票市場屬於淺碟型,因此外界的訊息易於影響股價波動;同時台灣是一個以個別投資人為主的散戶市場,外界的訊息會影響市場投資。因此,重大訊息的發布對公司股價變化的影響,值得我們進一步探討。
    本研究以公開資訊觀測站之重大訊息為資料來源,蒐集2005~2009年間統一、中華電信、長榮航空以及臺灣企銀四間上市公司之重大訊息共1382篇。利用文字探勘kNN演算法將四間公司之重大訊息加以分群,分析出各訊息的發布對於股價之影響程度,並找出不同群組之重大訊息的漲跌趨勢,期能對未來即時重大訊息的發布,分析出其對於股價之漲跌影響,進一步得到訊息發布日後兩日之報酬率走勢,成為日後投資標的之選擇參考。
    本研究結果顯示取樣公司於發布前兩日至發布後兩日,交易量有顯著之異常,顯示訊息發布對於公司股票確有影響;而不同的重大訊息內容,將會被分於不同之群組當中,各群組也各有其不同之漲跌趨勢,本研究於測試資料之分類結果,整體平均有六成五之準確率,在於上漲類別之準確率更高達八成;最後於發布後累積報酬率之影響,投資正確率平均高於六成。
    本研究透過系統化之分析與預測,省去投資者對於重大訊息之搜尋以及解讀的時間,提供投資者一個可供參考之依據。
    In this study we used the technique of text mining to classify the material information of companies and analyze how the disclosure of it affects the market. Hence, we would be able to predict the price of stock based on disclosures of the material information and then use the outcome as reference of investment.
    This study chose the Market Observation Post System as the source of information to its justice. We chose UNI-PRESIDENT ENTERPRISES CORP, Chunghwa Telecom Co., Ltd, EVA AIRWAYS CORPORATION and Taiwan Business Bank for their great evaluation of the information disclosure. We collected 1382 material information from 2005 to 2009 and for the better performance, we selected kNN algorithm as our rule of classification.
    We conducted three experiments in this study. In these experiments, we have approved that the trading volume of two periods were with significant differences. We have over 60% accuracy of the all data to classify the tested data. As a result, we found that the return rate of the “up” group has over 60% upside probability and the “down” group has over 60% downside probability.
    In this study, we built a time-saving automatic system to group material information and find out those that are valuable. Based on our result, we provided a reference to investors for their investment strategy. At the same time, we also came up with some inspiration for future research.
    Reference: 中文文獻
    1. 吳真蕙,2000,專業性報紙頭版新聞對股票價量的影響,中原大學會計系碩士論文。
    2. 李志宏,2004,資訊揭露前後交易者交易行為與流動性之研究:以台灣股市為例,行政院國家科學委員會專題研究計畫,未出版。
    3. 李建然、陳信卲、張石羨珍,2004,資訊評鑑系統與股票評價之攸關性,前會計理論與實務研討會,銘傳大學台北校區。
    4. 李春淋,2010,個股新聞對股價影響之研究-以台股為例,輔仁大學應用統計學系碩士論文。
    5. 李顯儀、吳幸姬,2005,台灣股票市場中訊息的反應與傳遞效果之研究,輔仁管理評論,第12卷,第3期,pp.71-94。
    6. 李顯儀、吳幸姬、王元章,2006,機構投資人的買賣行為與公共訊息認知差異之研究,台灣管理學刊,第6卷,第1期,pp.105-128。
    7. 汪修平,2010,投資人是否辨認自願性與強制性網路資訊之差異-網際網路詞頻技術之研究,國立中正大學會計與資訊科技研究所碩士論文。
    8. 林東清,2005,資訊管理e 化企業的核心競爭能力(再版),智勝文化出版
    9. 林章德,2000,上市公司重大投資宣告對股價影響之研究,東海大學管理研究所碩士論文。
    10. 張瑞當、方俊儒,2006,資訊揭露評鑑系統對企業盈餘管理行為之影響,會計評論,第42期,pp.1-22。
    11. 莊慶仁,2001,延長交易時間對台灣股市價格行為之影響,國立成功大學企業管理研究所碩士論文。
    12. 陳克健、陳正佳、林隆基,1986,中文語句的研究-斷詞與構詞,台北:中央研究院。
    13. 陳雪如、林琦珍、柯佳玲,2009,自願性資訊揭露對財務報導舞弊偵測之研究,會計與公司治理,第6卷,第2期,pp.1-30。
    14. 喻欣凱,2008,運用支援向量機與文字探勘於股價漲跌趨勢之預測,輔仁大學資訊管理學系碩士論文。
    15. 曾憲雄、蔡秀滿、蘇東興、曾秋蓉、王慶堯,2008,資料探勘,台北:旗標出版。
    16. 黃孝文,2010,雲端運算服務環境下運用文獻探勘於語意網路註解網頁文件分析之研究,國立政治大學資訊管理學系碩士論文。
    17. 劉玉珍、李怡宗、黃寶慧,2004,市場管理制度創新與行為財務學:資訊揭露制度設計的政策意涵,證券暨期貨月刊,第22卷,第4期。
    18. 劉繼鴻,2009,影音Web2.0平台網站上行銷傳播之社會網絡與資料探勘分析研究-以YouTube-Mac網絡為例,國立政治大學資訊管理學系碩士論文。
    19. 鍾雨潼,2002,臺灣2002年公開資訊觀測站重大訊息之資訊內涵分析,淡江大學管理科學系碩士論文。
    英文文獻
    1. Bohn, R., (1994), Measuring and Managing Technological Knowledge, Sloan Management Review, pp.61-72.
    2. Chen, K. J. and Liu, S. H., (1992), Word Identification for Mandarin Chinese Sentences,Fifth International Conference on Computational Linguistics, pp.101-107.
    3. Cormier, D., Ledoux, M. J., and Michel Magnan., (2009), The Use of Web Sites as a Disclosure Platform for Corporate Performance. International Journal of Accounting Information Systems, Vol.10, No.1, pp.1-24.
    4. Dice, Lee R., (1945), Measures of the Amount of Ecologic Association between Species, Journal of Ecology, Vol.26: pp.297-302.
    5. Einhorn, E., (2004), The Nature of the Interaction between Mandatory and Voluntary Disclosures. Journal of Accounting Research, Vol.43, pp.593-621.
    6. Fama, E.F., (1970), Efficient Capital Markets: A Review of Theory and Empirical Work., Journal of Finance, Vol.25, No.2, pp.383-417.
    7. Fayyad, Usama., Gregory Piatetsky-Shapiro, Padhraic Smyth, (1996), The KDD Process for Extracting Useful Knowledge from Volumes of Data, Communications of the ACM, Vol.39, pp.27-34.
    8. Foster, F. D. and Viswanathan S., (1993), The Effect of Public Information and Competition on Trading Volume and Price Volatility, Review of Financial Studies, Vol.6, pp.23-56.
    9. Gidófalvi, G., (2001), Using News Articles to Predict Stock Price Movements, Technical Report: CSE 254, Department of Computer Science and Engineering, University of California, San Diego.
    10. Healy, P. M., Hutton, A. P., Palepu, K. G.,(1999), Stock Performance and Intermediation Changes Surrounding Sustained Increases in Disclosure, Contemporary Accounting Research, Vol.16, No.3, pp.485-520.
    11. Jaccard and Paul, (1901), Étude Comparative de la Distribution Florale dans une Portion des Alpes et des Jura, Bulletin de la Société Vaudoise des Sciences Naturelles, Vol.37: pp.547–579.
    12. Kim, O. and Verrecchia R. E., (1991), Trading Volume and Price Reaction to Public Announcements, Journal of Accounting Research, Vol.29, pp.302-321.
    13. Makhoul, J., Kubala, F., Schwartz, R., and Weischedel, R., (1999), Performance Measures for Information Extraction. In Proc. DARPA Broadcast NewsWorkshop, pp.249-254.
    14. Nie, J. Y., Briscbois, M., Ren, X., (1996), On Chinese Text Retrieval, Proceedings of the 19th annual international ACM SIGIR conference on Research and development in information retrieval, pp.225-233.
    15. Nofsinger, J. R., (2001), The Impact of Public Information on Investors, Journal of Banking and Finance, Vol.25, pp.1339-1366.
    16. Paredes, Troy A., (2003), Blinded by the Light: Information Overload and Its Consequences for Securities Regulation, School of Law, Washington University.
    17. Popescu A., (2001), Implementation of Term Weighting in a Simple IR System, Personal Course Project, University of Helskinki.
    18. Salton G. and Buckley C., (1988),Term-Weighting Approaches in Automatic Text Retrieval, Information Process, Vol.24, No.5, pp.513-523.
    19. Salton, G. and McGill, M., (1983),Introduction to Modern Information Retrieval, McGraw-Hill.
    20. Samuelson, P. A., (1965), Proof that Properly Anticipated Prices Fluctuate Randomly, Industrial Management Review, Vol.6, pp.41-49.
    21. Sebastiani, Fabrizio ., (2002) ,Machine Learning in Automated Text Categorization, ACM Computing Surveys (CSUR),Surveys Homepage archive ,Vol.34.
    22. Shleifer, A., (2000), Inefficient Market, Oxford: Oxford U. Press.
    23. Sproat, R. and Shih, C., (1990), A Statistical Method for Finding Word Boundaries in Chinese Text, Computer Processing of Chinese and Oriental Languages, pp.336-351.
    24. Vapnik, V. N., (2000), The Nature of Statistical Learning Theory, Springer-Verlag,.
    25. Witten, I.H. and Frank, E., (2000), Data Mining: Practical Machine Learning Tools and Techniques with Java Implementations, Morgan Kaufmann, pp.76-80, pp.88-96, pp.149-151, pp.296-304.
    網路資料
    1. 公開發行公司取得或處分資產處理準則第30、31條,2008。2011年3月21日取自「證券暨期貨法令判解查詢系統」:http://www.selaw.com.tw/scripts/newsdetail.asp?no=G0100345
    2. 公開發行公司網路申報公開資訊應注意事項,2004。2011年3月21日取自「證券暨期貨法令判解查詢系統」:http://www.selaw.com.tw/scripts/NewsDetail.asp?no=G0100198
    3. 吳修辰,2006,「熱錢重新布局 年底前至少賺二○%」,商業周刊第972期。
    4. 證券交易法第178條,2010。2011年3月21日,取自「證券暨期貨法令判解查詢系統」:http://www.selaw.com.tw/scripts/newsdetail.asp?no=G0100001
    5. 第九屆資訊揭露評鑑系統FAQ,2011。2011年3月22日,取自「上市櫃公司揭露評鑑」:http://www.sfi.org.tw/edis/
    6. 集中交易市場成交金額投資人類別比例,2011。2011年3月22日,取自「中華民國統計資訊網」:http://www.stat.gov.tw/mp.asp?mp=4
    7. 臺灣證券交易所公開資訊觀測站資訊揭露處理原則,2009。2011年3月21日,取自「證券暨期貨法令判解查詢系統」:http://www.selaw.com.tw/Scripts/Query3.asp
    8. 臺灣證券交易所股份有限公司對上市公司重大訊息之查證暨公開處理程序,2010。2011年3月21日,取自「證券暨期貨法令判解查詢系統」:http://www.selaw.com.tw/Scripts/Query3.asp
    9. 臺灣證券交易所股份有限公司對上市證券投資信託基金之證券投資信託公司及上市境外指數股票型基金之境外基金機構重大訊息之查證暨公開處理程序第二條,2009。2011年3月21日,取自「證券暨期貨法令判解查詢系統」:http://www.selaw.com.tw/Scripts/newsdetail.asp?no=G0101081
    10. 臺灣證券交易所股份有限公司對有價證券上市公司重大訊息之查證暨公開處理程序第2、3條,2011。2011年3月21日,取自「證券暨期貨法令判解查詢系統」:http://www.selaw.com.tw/scripts/newsdetail.asp?no=G0100104
    Description: 碩士
    國立政治大學
    資訊管理研究所
    98356011
    98
    Source URI: http://thesis.lib.nccu.edu.tw/record/#G0098356011
    Data Type: thesis
    Appears in Collections:[Department of MIS] Theses

    Files in This Item:

    File SizeFormat
    601101.pdf1572KbAdobe PDF2338View/Open


    All items in 政大典藏 are protected by copyright, with all rights reserved.


    社群 sharing

    著作權政策宣告 Copyright Announcement
    1.本網站之數位內容為國立政治大學所收錄之機構典藏,無償提供學術研究與公眾教育等公益性使用,惟仍請適度,合理使用本網站之內容,以尊重著作權人之權益。商業上之利用,則請先取得著作權人之授權。
    The digital content of this website is part of National Chengchi University Institutional Repository. It provides free access to academic research and public education for non-commercial use. Please utilize it in a proper and reasonable manner and respect the rights of copyright owners. For commercial use, please obtain authorization from the copyright owner in advance.

    2.本網站之製作,已盡力防止侵害著作權人之權益,如仍發現本網站之數位內容有侵害著作權人權益情事者,請權利人通知本網站維護人員(nccur@nccu.edu.tw),維護人員將立即採取移除該數位著作等補救措施。
    NCCU Institutional Repository is made to protect the interests of copyright owners. If you believe that any material on the website infringes copyright, please contact our staff(nccur@nccu.edu.tw). We will remove the work from the repository and investigate your claim.
    DSpace Software Copyright © 2002-2004  MIT &  Hewlett-Packard  /   Enhanced by   NTU Library IR team Copyright ©   - Feedback