Title 古典中国語 ( 漢文 ) の形態素解析とその応用 安岡, 孝一 ; ウィッテルン, クリスティアン ; 守岡, 知彦 ; 池田, 巧 ; 山崎, 直樹 ; 二階堂, 善弘 ; 鈴木, 慎吾 ; 師, 茂. Citation 情報処理学会論文誌 (2018), 59(2):

Similar documents
ROSE リポジトリいばらき ( 茨城大学学術情報リポジトリ )

Reactive Fluid Dynamics 1 G-COE 科目 複雑システムのデザイン体系 第 1 回 植田利久 慶應義塾大学大学院理工学研究科開放環境科学専攻 2009 年 4 月 14 日. Keio University

The unification of gravity and electromagnetism.

Revisited (Hyper)-Elliptic Curve Sca Multiplication with a Fixed

ROSE リポジトリいばらき ( 茨城大学学術情報リポジトリ )

Title. CitationOptical Review, 22(1): Issue Date Doc URL. Rights. Type. File Information.

Technical report Approaches to Life Estimation of Electronic Circuits

2018 年 ( 平成 30 年 ) 7 月 13 日 ( 金曜日 ) Fri July 13, 2018

GRASS 入門 Introduction to GRASS GIS

Illustrating SUSY breaking effects on various inflation models

CMB の温度 偏光揺らぎにおける弱い重力レンズ効果 並河俊弥 ( 東京大学 )

2015 年度研究活動報告理工学術院 先進理工 応用物理学科小澤徹 Department of Applied Physics, Waseda University

Search and Digitalization of Maps at the National Diet Library

Thermal Safety Software (TSS) series

Day 5. A Gem of Combinatorics 組合わせ論の宝石. Proof of Dilworth s theorem Some Young diagram combinatorics ヤング図形の組合せ論

PROTEUS, AND THE NAME OF THE TYPE SPECIES OP THE GENUS HUENIA

モータ用モデル予測電流制御における 予測用モータモデルの磁気特性表現の改善

EDL analysis for "HAYABUSA" reentry and recovery operation はやぶさ カプセル帰還回収運用における EDL 解析

関数型 SIRMs 結合型ファジィ推論法による非線形同定に関する一考察 ( モデリングと最適化の理論 ) Citation 数理解析研究所講究録 (2006), 1526:

日本政府 ( 文部科学省 ) 奨学金留学生申請書

石炭灰フライアッシュから合成したゼオライトの水質 Title 浄化作用. 高見, 優子, 村山, 憲弘, 小川, 和男, 山本, 秀樹, Author(s) 芝田, 隼次. Citation 資源と素材 : 資源 素材学会誌, 116(9):

BCR30AM-12LB. RJJ03G Rev I T(RMS) 30 A V DRM 600 V I FGT I, I RGT I, I RGT III 50 ma : PRSS0004ZE-A ( : TO-3P) 4 2, 4

Agilent 4263B LCR Meter Operation Manual. Manual Change. Change 1 Add TAR in Test Signal Frequency Accuracy Test (Page 9-38) as follows.

[Code] [Credits] [Program] [Semester] [Hours]

Title rays. Citation Advanced Materials Research, 409: 5. Issue Date Journal Article. Text version author.

Yutaka Shikano. Visualizing a Quantum State

早稲田大学先進理工学部応用物理学科長谷川剛研究室 大学院先進理工学研究科物理及応用物理学専攻 大学院先進理工学研究科ナノ理工学専攻

Fast response silicon pixel detector using SOI. 2016/08/10 Manabu Togawa

C-H Activation in Total Synthesis Masayuki Tashiro (M1)

新技術説明会 ラマン分光 必見! AFM- ラマンによるナノイメージの世界 株式会社堀場製作所

業績リスト 2006 年 1 月 ~2006 年 12 月, 各論文の最終行の ( ) 内はキーワード

Ancient West Asian Civilization as a foundation of all modern civilization New Geological and Archaeological Academic Research in Japan

SOLID STATE PHYSICAL CHEMISTRY

一般化川渡り問題について. 伊藤大雄 ( 京都大学 ) Joint work with Stefan Langerman (Univ. Libre de Bruxelles) 吉田悠一 ( 京都大学 ) 組合せゲーム パズルミニ研究集会

Neural POS-Tagging with Julia

近距離重力実験実験室における逆二乗則の法則の検証. Jiro Murata

Study of Cloud and Precipitation Processes Using a Global Cloud-system Resolving Model

[Code] [Credits] [Program] [Semester] [Hours]

Numerical Simulation of Seismic Wave Propagation and Strong Motions in 3D Heterogeneous Structure

低温物質科学研究センター誌 : LTMセンター誌 (2013), 23: 22-26

水槽中で培養したマコンブ胞子体の子嚢斑形成と生長にお よぼす水温及び光周期の影響

開催日 :2015 年 9 月 日会場 : 情報通信研究機構 ( 小金井 ) 主催 :SCOSTEP, WDS 共催 : 名大 STE 研 国立極地研 NICT SGEPSS

非弾性散乱を利用した不安定核 核構造研究 佐藤義輝東京工業大学

車載用高効率燃焼圧センサー基板に最適なランガサイト型結晶の開発 結晶材料化学研究部門 シチズンホールディングス ( 株 )* 宇田聡 八百川律子 * Zhao Hengyu 前田健作 野澤純 藤原航三

山口英斉博士の研究業績概要 山口博士は 原子核物理学の実験的研究を専門とし 主に宇宙核物理学分野において 以下に述べる研究業績をあげてきました

Development of Flood Exposure Map Considering Dynamics of Urban Life. Yuling LIU, Norio OKADA, Dayong SHEN* and Yoshio KAJITANI**

Review of Electrohydrodynamics in Corona Devices in Electrophotography. Kazuhiro Mori

Relation of machine learning and renormalization group in Ising model

Kazuyoshi Z. Nanjo 1. Education Doctor of Science Master of Science Bachler of Science 2. Journal Articles [Refereed]

Takayama, Nobuki; Ohara, Katsuyoshi. Issue Date Journal Article. Text version author.

数理統計学から た Thermo-Majorization: 統計モデルの 較と情報スペクトル. National Institute of Informatics Keiji Matsumoto

質量起源 暗黒物質 暗黒エネルギー 宇宙線 陽子崩壊 ニュートリノ質量 米国 P5 ニュートリノ CPV 宇宙背景ニュートリノクォーク レプトンマヨラナ粒子 ニュートリノ測定器 陽子崩壊探索. Diagram courtesy of P5. Origin of Mass.

ROSE リポジトリいばらき ( 茨城大学学術情報リポジトリ )

業績リスト (2008 年以前 ) 48. Catalytic NO-H 2-O

マテリアルズインフォマティクスの最前線 吉田 亮. サイエンティフィック システム研究会 科学技術計算分科会 2017年度会合

Kyoko Kagohara 1, Tomio Inazaki 2, Atsushi Urabe 3 and Yoshinori Miyachi 4 楮原京子

結合および相互作用エネルギーの定量的 評価法の開発と新規典型元素化合物の構築

Shingo NAKANISHI and Masamitsu OHNISHI

SNOW/ICE ~ 雪氷災害 ~ LESSON 6

21 点 15 点 3 解答用紙に氏名と受検番号を記入し, 受検番号と一致したマーク部分を塗りつぶすこと 受検番号が 0( ゼロ ) から始まる場合は,0( ゼロ ) を塗りつぶすこと

Development of a High-Resolution Climate Model for Model-Observation Integrating Studies from the Earth s Surface to the Lower Thermosphere

I. Original. Lett., 39, 1382 (1977). Schneider, J. Chem. Phys., 68, 3401 (1978). Phys., 76, 5502(1982) (1985) (1987).

Reaction mechanism of fusion-fission process in superheavy mass region

Title volcanic deep low-frequency tremors. Citation Geophysical Research Letters, 34(7) Issue Date Journal Article. Text version author

Carotenoid Composition in the Yellow and Pale Green Petals of Primula Species

井出哲博士の研究業績概要 井出哲博士はこれまで データ解析や数値シミュレーションの手法を用いることによって 地震の震源で起きている現象を様々な角度から研究してきた その主な研究成果は 以下の 3 つに大別される

Author(s) Fujiwara, Yoshikazu; Fukukawa, Kenj. Citation Few-Body Systems (2013), 54(1-4): 4.

Kinetic Analysis of the Oxidation of Ascorbic Acid in an Open Reactor with Gas Bubbling

10) Photophysicochemical Properties of Chlorophyll-a Adsorbed on Mg-containing Mesoporous Silica

Youhei Uchida 1, Kasumi Yasukawa 1, Norio Tenma 1, Yusaku Taguchi 1, Jittrakorn Suwanlert 2 and Somkid Buapeng 2

On Attitude Control of Microsatellite Using Shape Variable Elements 形状可変機能を用いた超小型衛星の姿勢制御について

[ 粉体 砂丘の動力学 ] L.Guignier, H.Niiya, H. Nishimori, D. Lague and A. Valance: Sand dunes as migrating strings, Phys.Rev.E, Vol.87, (2013)

Citation Canadian geotechnical journal, 41(3

Sources and further reading

IAEA,NEA ISOE 国際 シンポジューム出張報告

外部電界によるグラフェン - 化学分子ファンデルワール ス相互作用制御と高機能素子応用. Citation 科学研究費助成事業研究成果報告書 :

Listening Comprehension Sample 1

むらの定量化について IEC-TC110 HHG2 への提案をベースに ソニー株式会社冨岡聡 フラットパネルディスプレイの人間工学シンポジウム

第 1 日 12 月 22 日 9:00 開会会場法政大学市ヶ谷キャンパス ( 東京都千代田区富士見 ) 富士見ゲート校舎 4 階 G403

Hideki; Shintani, Yuko; Sanada, Shi

1 1 1 n (1) (nt p t) (1) (2) (3) τ T τ. (0 t nt p ) (1) (4) (5) S a (2) (3) 0sin. = ωp

D j a n g o と P H P の仲間たち ( 改変済 ) サイボウズ ラボ株式会社 TSURUOKA Naoya

Algorithm Theoretical Basis Document for Cloud Top Height Product

Introduction to Multi-hazard Risk-based Early Warning System in Japan

( 主査 ) 教授髙橋秀幸教授山口信次郎准教授佐藤修正

Experimental and FE Analysis of Seismic Soil-Pile-Superstructure Interaction in Sand. Mahmoud N. HUSSIEN*, Tetsuo TOBITA and Susumu IAI

Title in the fish retina during optic ner

英語問題 (60 分 ) 受験についての注意 3. 時計に組み込まれたアラーム機能 計算機能 辞書機能などを使用してはならない 4. 試験開始前に 監督から指示があったら 解答用紙の受験番号欄の番号が自身の受験番号かどうかを確認し 氏名を記入すること

Method for making high-quality thin sections of native sulfur

Title - Relation between Pre-Processing a

Development of Advanced Simulation Methods for Solid Earth Simulations

二国間交流事業共同研究報告書 共同研究代表者所属 部局独立行政法人理化学研究所 創発物性科学研究センター

原子核の弱電相互作用と超新星ニュートリノ

履歴書 文世一 1958 年 7 月 30 日生

16. Yamamoto, S. (in press). Non-reciprocal but peaceful fruit sharing in the wild bonobos of Wamba. Behaviour, in press.

Mathematics 数理科学専修. welcome to 統合数理科学を 目 指 す 基礎理工学専攻

ATLAS 実験における荷電ヒッグス粒子の探索

Riemannゼータ関数の近似関数等式に対する平均値公式 ( 解析数論と数論諸分野の交流 ) Citation 数理解析研究所講究録 (1999), 1091:

Transcription:

Title 古典中国語 ( 漢文 ) の形態素解析とその応用 Author(s) 安岡, 孝一 ; ウィッテルン, クリスティアン ; 守岡, 知彦 ; 池田, 巧 ; 山崎, 直樹 ; 二階堂, 善弘 ; 鈴木, 慎吾 ; 師, 茂 Citation 情報処理学会論文誌 (2018), 59(2): 323-331 Issue Date 2018-02-15 URL http://hdl.handle.net/2433/229121 The copyright of this material is r Processing Society of Japan (IPSJ). on this web site with the agreement IPSJ. Please be complied with Copyr Right Code of Ethics of the IPSJ if any u derivative work, distribute or make part or whole thereof. All Rights R Information Processing Society of J は情報処理学会に帰属します 本著作物は著作権者である情報処理学会の許可のもとに掲載するものです Type Journal Article Textversion publisher Kyoto University

1,a) 1,b) 1,c) 1,d) 2,e) 2,f) 3,g) 4,h) 2017 5 9, 2017 11 7 MeCab 4 MeCab MeCab XEmacs CHISE MeCab MeCab Linked Data WWW MeCab Morphological Analysis of Classical Chinese Texts and Its Application Koichi Yasuoka 1,a) Christian Wittern 1,b) Tomohiko Morioka 1,c) Takumi Ikeda 1,d) Naoki Yamazaki 2,e) Yoshihiro Nikaido 2,f) Shingo Suzuki 3,g) Shigeki Moro 4,h) Received: May 9, 2017, Accepted: November 7, 2017 Abstract: A method to analyze classical Chinese texts is proposed. In the method, we use our original morphological analyzer based on MeCab. We propose a new four-level word-class system to represent the predicate-object structure of classical Chinese. In order to make a corpus for classical Chinese on MeCab, we have constructed a MeCab-corpus editor based on XEmacs CHISE. In order to control the corpus effectively, and to refactor our four-level word-class system, we have converted it into Linked Data on WWW. As an applied study for our morpholgical analysis of classical Chinese texts, we have tried to extract named entities: names of places, job titles, and names of people. As a result we are able to extract names of places from classical Chinese texts almost perfectly. But we have found some difficulties to extract job titles or names of people. Keywords: classical Chinese corpus, linked data, named entity extraction 1 Kyoto University, Kyoto 606 8501, Japan 2 Kansai University, Suita, Osaka 564 8680, Japan 3 Osaka University, Minoh, Osaka 562 8558, Japan 4 Hanazono University, Kyoto 604 8456, Japan a) yasuoka@kanji.zinbun.kyoto-u.ac.jp b) wittern@zinbun.kyoto-u.ac.jp c) tomo@kanji.zinbun.kyoto-u.ac.jp d) ikeda@zinbun.kyoto-u.ac.jp e) ymzknk@kansai-u.ac.jp f) nikaido@kansai-u.ac.jp g) suzukish@lang.osaka-u.ac.jp h) s-moro@hanazono.ac.jp 1. c 2018 Information Processing Society of Japan 323

Fig. 1 1 MeCab-corpus editor for classical Chinese. 2008 4 2013 4 [1] [2], [3] [4] [5], [6] 2. MeCab [7] MeCab MeCab MeCab v n p MeCab 1 2 IPA [8], [9] MeCab IPA MeCab MeCab 4 c 2018 Information Processing Society of Japan 324

Fig. 2 2 A new four-level word-class system for classical Chinese. MeCab 2010 4 3 B 22300087 MeCab XEmacs CHISE [10] c 2018 Information Processing Society of Japan 325

1 F / // Table 1 F-measures on MeCab-corpola for classical Chinese. M K R M 100 97/90/88/80 97/87/85/82 K 89/85/82/83 100 95/88/83/79 R 93/86/83/80 85/73/72/64 100 MeCab 1 v,,,,*,*,,,,* v,,,,*,*,,,, v,,,,*,*,,,, n,,,,*,*,,,,* n,,,,*,*,,,,* MeCab MeCab 4 2 1 2 3 4 n v p 3 9 [11] 44 88 MeCab MeCab MeCab [12] M 69 K 68 R 320 MeCab 5,500 MeCab 0.994 F / // 1 R R K 46,000 1 3.9 3. Linked Data MeCab MeCab Linked Data [13] MeCab 3 1 CHISE 3 3 Linked Data WWW [14] n,,, n,,, c 2018 Information Processing Society of Japan 326

3 Linked Data Fig. 3 Linked Data around. 4. MeCab 2013 4 3 B 25280122 4.1 MeCab n,,, n,,, 2 2 MeCab 2 10% 10%n,,, 2 90% MeCab 2 MeCab 3 MeCab 1 1 MeCab v,,, v,,, n,,, c 2018 Information Processing Society of Japan 327

2 F / // Table 2 F-measures on MeCab-dictionaries for classical Chinese. P M R α 96/86/85/76 93/90/90/77 96/83/81/71 β 96/89/88/84 93/90/90/76 96/83/81/71 γ 96/86/84/73 93/90/90/77 94/81/79/69 1 MeCab MeCab 2 1 n,,, v,,, MeCab 46,000 MeCab 2,000 6,300 400 v,,,,*,*,,,,* v,,,,*,*,,,, n,,,,*,*,,,,* 3 MeCab [15] α MeCab β α 1 γ α α 111 β 1,240 γ 0 1 P 88 P [12] M 69 R 320 α β γ 2,000 MeCab 0.996 F / // 2 P α β F α γ F P P F n,,,,*,*,,,,* v,,,,*,*,,,, n,,,,*,*,,,,* n,,,,*,*,,,,* n,,,,*,*,,,,* n,,,,*,*,,,,* 1 α γ M β F M β R α β F γ F R γ F β R β P β M R c 2018 Information Processing Society of Japan 328

β MeCab 4.2 MeCab MeCab n,,,,*,*,,,,* n,,,,*,*,,,,* v,,,,*,*,,,, v,,,,*,*,,,, n,,,,*,*,,,,* *1 1 *1 v,,, v,,, v,,, 4.3 MeCab n,,, n,,, n,,, n,,, 16 6 n,,,,*,*,,,,* n,,,,*,*,,,,* 10 10 9 n,,, 1 n,,,* 1 c 2018 Information Processing Society of Japan 329

5. F [8], [12], [15] F F F [1] Vol.21, No.3, pp.8 18 (2007). [2] Jiang, W., Huang, L., Liu, Q. and Lü, Y.: A Cascaded Linear Model for Joint Chinese Word Segmentation and Part-of-Speech Tagging, Proc. ACL-08, pp.897 904 (2008). [3] Shen, M., Liu, H., Kawahara, D. and Kurohashi, S.: Chinese Morphological Analysis with Character-level POS Tagging, Proc. ACL-2014, pp.253 258 (2014). [4] Huang, L., Peng, Y., Wang, H. and Wu, Z.: Statistical Part-of-Speech Tagging for Classical Chinese, Proc. TSD 2002, pp.115 122 (2002). [5] Yasuoka, K., Yamazaki, N., Wittern, C., Nikaido, Y. and Morioka, T.: A Morphological Analysis of Classical Chinese Texts, Proc. Digital Humanities 2014, pp.410 412 (2014). [6] Wittern, C., 27 pp.3 14 (2016). [7] MeCab Vol.2008-CH-79, pp.17 22 (2008). [8] MeCab Vol.2009-CH-84, No.3, pp.1 5 (2009). [9] Morioka, T.: A Prototype of a Classical Chinese Morphological Analyzer based on MeCab, Proc. Osaka Symposium on Digital Humanities 2011, p.36 (2011). [10] 23 pp.75 83 (2012). [11] Pulleyblank, E.G.: Outline of Classical Chinese Grammar, UBC Press (1995). [12] 2012 pp.39 46 (2012). [13] Linked Data 2013 pp.187 194 (2013). [14] CHISE 25 pp.33 46 (2014). [15] Wittern, C. 2014 pp.63 68 (2014). 1965 1990 1990 1997 2000 2009 2015 1962 1991 1998 1998 2001 2009 2012 c 2018 Information Processing Society of Japan 330

1969 1999 1999 COE 2000 2009 1973 2007 2008 2011 2012 1962 1990 1993 1999 2013 1972 1995 2001 3DCG 1962 1962 1985 1997 1997 1998 2004 2005 c 2018 Information Processing Society of Japan 331