読者です 読者をやめる 読者になる 読者になる

ウニ’s blog

勉強した結果を書いていきます

新Google翻訳のAPIを試す(4)

Python

html(xhtml)を読み込ませて、翻訳させる、結果を出力する、まで完成。

htmlの構文解析して、文字列部分を辿る処理の実装具合が非常に良くない。
あらゆるePubに対応できるか?というと、無理だ。
やはりChrome経由のgoogle webページ翻訳が新Google翻訳対応するのを待ったほうが良いという結論。
ブラッシュアップするには筋が悪い。

f:id:uni8inu:20161219234828p:plain
技術書翻訳例

翻訳サンプルとして使用した技術書

Git - Book

考察

せっかくここまでやったので、サンプルコードを公開するところまではやろう。
2タイプ準備する、というところをゴールにしよう。

1. ePubを直接翻訳して、別のePubファイルを作成する君
2. ePubを回答して、中身のファイル(html)を指定して、htmlを置き換える君
2.1 元のファイルはorg_XXX.htmlとかに退避する