政大機構典藏-National Chengchi University Institutional Repository(NCCUR):Item 140.119/33896
English  |  正體中文  |  简体中文  |  Post-Print筆數 : 27 |  全文笔数/总笔数 : 113318/144297 (79%)
造访人次 : 50983029      在线人数 : 797
RC Version 6.0 © Powered By DSPACE, MIT. Enhanced by NTU Library IR team.
搜寻范围 查询小技巧:
  • 您可在西文检索词汇前后加上"双引号",以获取较精准的检索结果
  • 若欲以作者姓名搜寻,建议至进阶搜寻限定作者字段,可获得较完整数据
  • 进阶搜寻
    政大機構典藏 > 商學院 > 統計學系 > 學位論文 >  Item 140.119/33896


    请使用永久网址来引用或连结此文件: https://nccur.lib.nccu.edu.tw/handle/140.119/33896


    题名: 以資料採礦的方法探索影響台灣地區女性戶長的原因
    作者: 李孟謙
    LEE, MENG CHIEN
    贡献者: 余清祥
    李孟謙
    LEE, MENG CHIEN
    关键词: 女性戶長
    攝謢腺癌
    資料採礦
    男女平權
    分類
    監督學習
    householder
    prostate cancer
    data mining
    equal right
    classification
    data learning
    日期: 2004
    上传时间: 2009-09-17 18:45:12 (UTC+8)
    摘要: 「資料採礦」(Data Mining)為一種結合統計分析、資訊工程和各領域間專業知識的一種新興分析技術,例如:產業界的市場分析,金融界的財務分析,保險業的風險管理,生物科技界的疾病分析以及政府的人口統計,在各行各業使用資料採礦技術的人員日益增加。然而,正因資料採礦屬於新興發展的領域,仍有不少事項尚待開發,例如:不同型態的資料如何處理。本文即探討兩種不同型態的資料:資料量多、變數少以及資料量少、變數多兩種,以監督學習(Supervised Learning)和分類(Classification)的概念,分別對觀察值較多的2000年台灣地區戶口普查資料探討影響女性戶長的因素,而對變數較多的攝謢腺癌資料詮釋血清的病症類型,研究不同的類型資料可能的處理步驟。
    本文主要的結論為:1.當資料量多時,引入抽樣的概念,資料採礦可利用抽樣將資料量縮減,減少處理時間,並且抽樣資料和全部資料在分類錯誤率的差異頗為相近,因此抽樣為一種可行的處理方式。以研究女性戶長為例,資料量最少的東部資料為抽樣代表,在不失分類準確性的前提下,抽樣3%資料的分析結果與使用整體資料的結果相差不多,達到合乎經濟效應。2.當資料量少時,引入變數縮減的想法,使用敘述性統計量和不均度的17個指標統計量,能替代全部變數進行分析,運用羅吉斯迴歸方法,分類錯誤率的結果在可接受範圍內,並且解決在傳統分析上自由度不夠的問題。以研究攝護腺癌症為例,在不損失太多分類正確性的原則下,將血清透過質譜儀所反映的強度,透過變數縮減的技巧提高分析效率;另外,縮減變數後自由度充足,傳統的統計方法可運用在攝護腺癌的資料上,使分析的工具有較廣泛的選擇。
    參考文獻: (一)中文部份:
    中華資料採礦協會。(http://cdms.sat.fju.edu.tw/)
    中國人權協會(2002),台灣婦女人權指標調查報告。
    內政部(2000),中華民國台閩地區人口統計。
    台大婦女研究室。(http://www-ms.cc.ntu.edu.tw/%7Ewrp/)
    民生報(2002),男女同工不同酬 女性重視升遷。
    (http://www.jbjob.com.tw/word/html/word768.htm)
    行政院主計處第三局九十年社會指標統計目錄。
    (http://www.dgbas.gov.tw/dgbas03/bs2/91chy/catalog.htm)
    林心如(1998),聯合國與女性人權,新世紀智庫論壇。(http://taiwan.yam.org.tw/womenweb/papers/united.htm)
    法務部(2002) 民法親屬編夫妻財產制修正案立法院完成三讀,建立家庭中兩性地位平等的新里程碑。
    (http://www.moj.gov.tw/more_news1.asp?y=91&m=6&num=11)
    財團法人尹書田紀念醫院(http://www.shutien.org.tw/html/stuc62.htm)
    陳彥良(2002)資料間隱含關係的挖掘與展望,資訊管理學報第九卷,專刊期,pp. 75-100。
    陳美華(1999),社會運動團體與立法院的互動□婦女運動團體推動男女平權立法的經驗。(http://www.inpr.org.tw/inprc/recent/event6_4.htm)
    異視市場資訊研究中心(2001),e世代女性權益調查公佈記者會。
    (http://www.npf.org.tw/Symposium/s90/900904-SS.htm)
    郭玲惠(1998),婦女新知,「婦女新知民法諮詢熱線年度報告」。
    梁崇民(2002),自由電子新聞網,自由廣場。(http://www.libertytimes.com.tw/2002/new/jun/9/today-o1.htm)
    許炯明(2002)中國時報。
    (http://www.astrazeneca.com.tw/article.asp?channelid=C31&serial=204)
    雅芳健康生活網。(http://wellness.avon.com.tw/health/h1-1.asp?index_no=10&cno=03)
    張延驊 (2002) (http://www.astrazeneca.com.tw/article.asp?channelid=C31&serial=41)
    劉毓秀(1995),婦女新知 還我財產權□女人釋憲行動II,第154期,12-13頁。
    饒志堅(2002),由普查資料探討台灣兩性差異-以1990及2000年戶口普查資料為例,華人人口與社會經濟研究: 2000/2001年度人口普查資料分析研討會,香港。
    (二)英文部份:
    Alan, A. (1995), An Introduction to Categorical Data Analysis, Wiley Series in Probability and Statistics.
    Burges, C. (1998), A Tutorial on Support Vector Machines for Pattern Recognition, Data Mining and Knowledge Discovery,2(2):955-974.
    Chapelle, O., Vapnik, V., Bousquet, O., and Mukherjee, S. (2000), Choosing Kernel Parameters for Support Vector Machines, Technical Report, AT&T Labs.
    Craven, M. W. and Shavlik, J. W. (1997), Using Neural Network for Data Mining, Future Generation Computer System, pp. 221-229.
    David, W. H. and Stanley, L. (2000), Applied Logistic Regression, Wiley.
    Han, J. and Kamber, M. (2000), Data Mining: Concepts and Techniques, Morgan Kaufmann Publishers, San Franscisco.
    John, O. R., Sastry, G. P. and David, A. D.(1998), Applied Regression Analysis, Springer.
    Jutten, C. and Chentouf, R. (1995), Neural Processing Letters, 2, 1, pp. 1-4.
    Leo, B., Jerome, H. F., Richard, A. O. and Charles, J. S. (1984), Classification and Regression Tree, Wadsworth Statistic/Probability Series.
    Nello, C. and John, S. T. (2000), An Introduction to Support Vector Machines and other Kernel-Based Method, Cambridge University Press.
    Simoudis, E. (1996), Reality Check for Data Mining, IEEE Expert (11:10), 26-33.
    Stephen, I. G. (1992), Neural Network Learning and Expert System. Cambridge, Mass.: MIT Press
    Vapnik, V. (1995), The Nature of Statistical Learning Theory, Springer.
    .
    描述: 碩士
    國立政治大學
    統計研究所
    90354014
    93
    資料來源: http://thesis.lib.nccu.edu.tw/record/#G0090354014
    数据类型: thesis
    显示于类别:[統計學系] 學位論文

    文件中的档案:

    档案 描述 大小格式浏览次数
    35401401.pdf20KbAdobe PDF2798检视/开启
    35401402.pdf16KbAdobe PDF2963检视/开启
    35401403.pdf14KbAdobe PDF2826检视/开启
    35401404.pdf11KbAdobe PDF2858检视/开启
    35401405.pdf20KbAdobe PDF2963检视/开启
    35401406.pdf61KbAdobe PDF211495检视/开启
    35401407.pdf87KbAdobe PDF21057检视/开启
    35401408.pdf70KbAdobe PDF21592检视/开启
    35401409.pdf26KbAdobe PDF21163检视/开启
    35401410.pdf30KbAdobe PDF21115检视/开启
    35401411.pdf844KbAdobe PDF2919检视/开启


    在政大典藏中所有的数据项都受到原著作权保护.


    社群 sharing

    著作權政策宣告 Copyright Announcement
    1.本網站之數位內容為國立政治大學所收錄之機構典藏,無償提供學術研究與公眾教育等公益性使用,惟仍請適度,合理使用本網站之內容,以尊重著作權人之權益。商業上之利用,則請先取得著作權人之授權。
    The digital content of this website is part of National Chengchi University Institutional Repository. It provides free access to academic research and public education for non-commercial use. Please utilize it in a proper and reasonable manner and respect the rights of copyright owners. For commercial use, please obtain authorization from the copyright owner in advance.

    2.本網站之製作,已盡力防止侵害著作權人之權益,如仍發現本網站之數位內容有侵害著作權人權益情事者,請權利人通知本網站維護人員(nccur@nccu.edu.tw),維護人員將立即採取移除該數位著作等補救措施。
    NCCU Institutional Repository is made to protect the interests of copyright owners. If you believe that any material on the website infringes copyright, please contact our staff(nccur@nccu.edu.tw). We will remove the work from the repository and investigate your claim.
    DSpace Software Copyright © 2002-2004  MIT &  Hewlett-Packard  /   Enhanced by   NTU Library IR team Copyright ©   - 回馈