2. Tree-to-String [6] (Phrase Based Machine Translation, PBMT)[1] [2] [7] (Targeted Self-Training) [7] Tree-to-String [3] Tree-to-String [4]

Size: px

Start display at page:

Download "2. Tree-to-String [6] (Phrase Based Machine Translation, PBMT)[1] [2] [7] (Targeted Self-Training) [7] Tree-to-String [3] Tree-to-String [4]"

Meghan Aileen George
5 years ago
Views:

1 1,a) 1,b) Graham Nubig 1,c) 1,d) 1,) 1. (Phras Basd Machin Translation, PBMT)[1] [2] Tr-to-String [3] Tr-to-String [4] [5] 1 Graduat School of Information Scinc, Nara Institut of Scinc and Tchnology a) morishita.makoto.mb1@is.naist.jp b) akab.koichi.zx8@is.naist.jp c) nubig@is.naist.jp d) koichiro@is.naist.jp ) s-nakamura@is.naist.jp [6] [7] (Targtd Slf-Training) [7] Tr-to-String 2. Tr-to-String f P r( f) ê c 2015 Information Procssing Socity of Japan 1

2 x 0 : P 1 P P x 1 : P x 0 saw a x 1 P ê := argmax P r( f) (1) Tr-to-String T f 2 Tr-to-String ê := argmax P r( f) = argmax P r( f, T f )P r(t f f) (2) T f argmax P r( T f )P r(t f f) (3) T f argmax P r( ˆT f ) (4) ˆT f ˆT f = argmax T f P r(t f f) (5) Tr-to-String 1 x 1 x 0, x 1 n n-bst Tr-to-String (Hypr-Graph) Forst-to-String [8] [9]Forst-to-String ê, ˆT f = arg max,t f P r( T f )P r(t f f) (6) (5) ˆ T f Charniak WSJ [10] (Probabilistic Contxt-Fr Grammar, PCFG) [11] PCFG-LA (PCFG with Latnt Annotations) [12]PCFG-LA EM PCFG-LA 3.2 Katz-Brown [13] [7] T f f rord(t f ) f scor(f, f ) ˆT f T f ˆT f = arg max T f T f scor(f, rord(t f )) (7) Tr-to-String [6] Tr-to-String 1-bst Tr-to-String c 2015 Information Procssing Socity of Japan 2

3 Katz-Brown [7] 1-bst Oracl bst 2 1-bst 1-bst (6) ˆT f bst 1-bst 1-bst n-bst E Oracl ē rror( ) ē = argmin E rror(, ) (8) n-bst Oracl Oracl 1-bst n-bst 1-bst Oracl Oracl Tr-to-String t i Oracl ē (i) Oracl E scor() {i scor(ē (i) ) t, ē (i) E} (9) 1-bst Oracl 1-bst Oracl Oracl 1-bst 1-bst ê (i) Oracl ē (i) c 2015 Information Procssing Socity of Japan 3

4 gain(ē (i), ê (i) ) = scor(ē (i) ) scor(ê (i) ) (10) (9) Gascó [14] N( + f ) f f + f N p( + f ) = N( + f ) N (11) ASPEC *1 WAT2014[15] Nubig [16] *2 Travatar[17] Forst-to-String PCFG-LA Egrt *3 JDC[18]( 7000 ) Egrt BLEU[19]RIBES[20] 2 BLEU+1[21] JDC ASPEC JDC [22] Parsr 1-bst (5) Egrt 1-bst MT 1-bst Egrt Travatar Travatar 1-bst *1 *2 *3 Oracl MT 1-bst Travatar 500-bst BLEU+1 n-bst Oracl (BLEU+1 t) Oracl BLEU+1 BLEU+1 Gain Oracl (BLEU+1 t) 1-bst Oracl BLEU+1 1/20 1/10 BLEU+1 Gain ( : p < 0.05, : p < 0.01) 1 (b),(c),(d) Egrt Sntncs JDC [6] Parsr 1-bst ( 1(b)) MT 1-bst Parsr 1-bst ( 1(c)) Oracl MT 1-bst ( 1(d)) BLEU+1 2 x c 2015 Information Procssing Socity of Japan 4

5 1 Sntnc slction Tr slction Sntncs (k) BLEU RIBES (a) Baslin (b) Parsr 1-bst Random Parsr 1-bst (c) MT 1-bst Random MT 1-bst (d) Oracl Random BLEU+1 1-bst () Oracl (BLEU+1 0.7) BLEU BLEU+1 1-bst (f) Oracl (BLEU+1 0.8) BLEU BLEU+1 1-bst (g) Oracl (BLEU+1 0.9) BLEU BLEU+1 1-bst (h) BLEU+1 Gain BLEU+1 Gain BLEU+1 1-bst Sntnc slction Tr slction Sntncs (k) BLEU RIBES (a) Baslin (b) Oracl Random BLEU+1 1-bst (c) Oracl (BLEU+1 0.8) BLEU BLEU+1 1-bst (d) Oracl (BLEU+1 0.9) BLEU BLEU+1 1-bst () BLEU+1 Gain BLEU+1 Gain BLEU+1 1-bst (f) Oracl (BLEU+1 0.8, Ja-En) BLEU BLEU+1 1-bst Sntncs 25k 20k 15k 10k 5k BLEU+1 Scor 2 Oracl BLEU+1 x x BLEU+1 Oracl BLEU+1 BLEU+1 ( 1(),(f),(g)) BLEU+1 MT 1-bst Oracl BLEU+1 BLEU+1 ( 1(h)) Tr-to-String 6. Tr-to-String 2 c 2015 Information Procssing Socity of Japan 5

6 3 Sourc Rfrnc in th C - administrd group, thrmal raction clarly incrasd th activity of R for 240 minuts. Baslin for 240 minuts clarly nhancd th activity of C administration group R. Oracl (BLEU+1 0.8) for 240 minuts clarly nhancd th activity of R in th C - administration group. P P P P P P P P P P P P P P P P P C P R C R (b) (a) 3 JSPS [1] Kohn, P., Och, F. J. and Marcu, D.: Statistical phrasbasd translation, Proc. HLT, pp (2003). [2] Yamada, K. and Knight, K.: A syntax-basd statistical translation modl, Proc. ACL (2001). [3] Liu, Y., Liu, Q. and Lin, S.: Tr-to-String Alignmnt Tmplat for Statistical Machin Translation, Proc. ACL (2006). [4] Nubig, G. and Duh, K.: On th Elmnts of an Accurat Tr-to-String Machin Translation Systm, Proc. ACL, pp (2014). [5] McClosky, D., Charniak, E. and Johnson, M.: Effctiv slf-training for parsing, Proc. HLT-NAACL, pp (2006). [6] Nubig, G.Sakti, S. Tr-to-String 21 (2015). [7] Katz-Brown, J., Ptrov, S., McDonald, R., Och, F., Talbot, D., Ichikawa, H., Sno, M. and Kazawa, H.: Training a Parsr for Machin Translation Rordring, Proc. EMNLP, pp (2011). [8] Mi, H., Huang, L. and Liu, Q.: Forst-Basd Translation, Proc. ACL, pp (2008). [9] Zhang, H. and Chiang, D.: An Exploration of Forstto-String Translation: Dos Translation Hlp or Hurt Parsing?, Proc. ACL, pp (2012). [10] Marcus, M. P., Marcinkiwicz, M. A. and Santorini, B.: Building a larg annotatd corpus of English: Th Pnn Trbank, Computational linguistics, Vol. 19, No. 2, pp (1993). [11] Charniak, E.: Statistical Parsing with a Contxt-Fr Grammar and Word Statistics, Proc. AAAI, pp (1997). [12] Huang, Z. and Harpr, M.: Slf-Training PCFG grammars with latnt annotations across languags, Proc. EMNLP, pp (2009). [13] Xia, F. and McCord, M.: Improving a statistical MT systm with automatically larnd rwrit pattrns, Proc. COLING (2004). [14] Gascó, G., Rocha, M.-A., Sanchis-Trills, G., Andrés- Frrr, J. and Casacubrta, F.: Dos mor data always yild bttr translations?, Proc. ACL, pp (2012). [15] Nakazawa, T., Mino, H., Goto, I., Kurohashi, S. and Sumita, E.: Ovrviw of th 1st Workshop on Asian Translation, Proc. WAT (2014). [16] Nubig, G.: Forst-to-String SMT for Asian Languag Translation: NAIST at WAT2014, Proc. WAT (2014). [17] Nubig, G.: Travatar: A Forst-to-String Machin Translation Engin basd on Tr Transducrs, Proc. ACL Dmo Track, pp (2013). [18] Mori, S., Ogura, H. and Sasada, T.: A Japans Word Dpndncy Corpus, Proc. LREC (2014). [19] Papinni, K., Roukos, S., Ward, T. and Zhu, W.-J.: BLEU: a mthod for automatic valuation of machin translation, Proc. ACL, pp (2002). [20] Isozaki, H., Hirao, T., Duh, K., Sudoh, K. and Tsukada, c 2015 Information Procssing Socity of Japan 6

7 H.: Automatic Evaluation of Translation Quality for Distant Languag Pairs, Proc. EMNLP, pp (2010). [21] Lin, C.-Y. and Och, F. J.: Orang: a mthod for valuating automatic valuation mtrics for machin translation, Proc. COLING, pp (2004). [22] Kohn, P.: Statistical significanc tsts for machin translation valuation, Proc. EMNLP (2004). c 2015 Information Procssing Socity of Japan 7

Shift-Reduce Word Reordering for Machine Translation

Shift-Reduce Word Reordering for Machine Translation Katsuhiko Hayashi, Katsuhito Sudoh, Hajime Tsukada, Jun Suzuki, Masaaki Nagata NTT Communication Science Laboratories, NTT Corporation 2-4 Hikaridai,