1998年3月31日(火曜日)
いよいよ今年度も今日で終わり。明日から98年度となる。
私のサラリーマンの経験値も1つ上がる(つまり1年増える)。だからどうしたということもない。来年こそは何か面白いことを見つけたい。
最近、これといって仕事をした記憶がないので、そろそろ脳ある鷹もツメを出してみたいものだ。
1998年3月30日(月曜日)
音声認識という分野がある。音声をコンピュータで認識しようとしている。難しい。世の中には音声XXXという装置がたくさん出ているが、まともに認識できるものはない。カーナビとか、電話とか、いろいろあるが、認識できると言うのには、まだまだ遠い。
文字の方はかなり高い確率でコンピュータが理解できるが、音声はまだまだ。
人間が喋っているのをコンピュータで認識する場合、音の波形を取り込み、それを何らかの方法(パターン・マッチングとか)で、何を言っているかを識別するのだが、そもそも人が喋る言葉というのは十人十色。音の波形もかなり違う。
簡単にパターン・マッチングはできない。パターン・マッチングしても、かなり不正確になる。それで、世間の音声XXXには間違いが多い。
認識する用語を限定するなり、あらかじめ喋って学習させるなり、さまざまな方法があるが、まだ決定的じゃない。
たとえば、日本人なら99%以上の日本人が喋ることを理解できる(方言を除く)が、なぜか?
それは膨大な「知識」があるからだ。つまり、人間は生きていく中で膨大な「知識」を蓄積している。たとえば、日本語の文法もその経験の一つ。文法どおりに喋っているという暗黙の了解、つまり「知識」がある。「ちょーすげー」なんて生まれて初めて聞いたら言語自体を聞き取れない。めちゃめちゃな日本語をぺらぺらと喋ったら、99%以上の人が理解できない。例えば日本語では「ん」は1つの発音だが、中国人が聞くと「ん」には3種類あるらしい。「図鑑」の「ん」と、「漫画」の「ん」は発音が違うらしい。ほかの言葉も同様。
例えば、「わこばだせいおざえわくぷべほかむらへぼちとえりく」というのをペラペラと喋られて、聞いたあと、紙に書き移せる人はいない。
これが、「わたしはきのうふらんすりょうりをたべにいってたくさんたべました」というのをペラペラ喋られても、紙に書き移せると思う。
前者は人間でも理解できないのだから機械に理解させようというのはかなり難しい。
私は、特定のアメリカ人の友人が喋る言葉は100%理解できても、ちょっと人が変わると理解できないことがよくある。これも「知識」がないからだ。文法の知識、しゃべり方の知識、話の流れの知識など。同じ人とずっと付き合っていると、その人のパターンを蓄積できる。だから100%理解できるようになる。しかし、それ以外の人の知識がないので、ちょっと人が変わると、その友人と喋っていた知識を適用できない。(近ければ適用できるが)
将来、音声認識であらゆる人の喋る言葉を理解できるシステムができるとしたら、それは膨大なデータベースを使っていると思う。膨大な知識(データベース)を駆使してあらゆる人の喋りを理解できるようになっていると思う。ただし依然として「わこばだせいおざえわくぷべほかむらへぼちとえりく」は理解できていないだろう。
ちょっと前、チェスのチャンピオンにコンピュータ(IBMのディープ・ブルー)が勝ったが、これも膨大な知識に支えられた勝利。音声の識別も同じだ。
日本人が日本語を理解できるのも、アメリカ人が英語を理解できるのも、膨大な知識を長年に渡って蓄積しているからで、音波だけでは言語は理解できない。
私がアメリカ人の話を理解できないことが多いのは、ここら辺に原因があるわけだ。ヒアリングの練習で何度も何度も聞く必要があるのは、さまざまな「知識」を身につけるため。
人間は、決して、音の波形を単純に言語に置き換えているわけではない。ヒアリングが奥深いのは、こういうところに理由があると思う。
1998年3月29日(日曜日)
B社の翻訳を淡々とこなしている。今日も40ページほど訳した。かなりのハイペースなのでしんどい。
今回のように得意分野だと専門用語を調べる必要もなく、辞書を引く必要もほとんどないので、いかに原文を速く理解して、いかに訳文を速く入力するかが、勝負となる。
1時間に5ページは訳していると思う。1ページ400字として5ページで2000文字。とすると、1時間は3600秒だから、1秒間に0.5文字を入力していることになる。ローマ字入力して変換しているので、ちょうど1秒間にキーボードを一回叩いている計算になる。これ以上は無理か…。
ちなみに今日は40ページほどなので、単純計算では8時間ほど訳したことになるが、連続して8時間訳すのは私には無理。とても神経が続かない。今日一日、休みながら8時間訳している。なので拘束時間としてはかなり長い。翻訳を職業にして毎日このペースで翻訳すのは難しそう。
どちらにしても、昨日、今日とがんばったので、風邪で3日ぐらい寝込んでも納期には間に合いそうだ。
1998年3月28日(土曜日)
昨日は飲みに行って、朝4時まで飲んでいたので日記が書けなかった。
今日はB社から宅急便で新しい仕事が来た。内容は、ネットワーク関連製品のマニュアル。全部で150ページぐらい。納期は4月7日。
幸いなことに二日酔いもなかったので、かなり翻訳できた。今日はA社から来た週刊の翻訳も合わせて50ページは訳した。今までの最高記録だと思う。
ところで、このあいだのB社の「デスマッチ翻訳」だが、これのお客さんはM社(世界最大のコンピュータソフトウェアの企業)で、内容はWebのホームページの翻訳だったのだが、お客さんのレビューの結果、「翻訳の評価がかなり高かった。」というコメントをもらった。こういうコメントがもらえると、うれしい。
A社の前回の翻訳も「とてもよかった」という、ひさびさに「おほめ」のコメントをもらった。
良いことが続くこともあるもんだ。
1998年3月26日(木曜日)
車関係のメーリングリストに入っているのだが、今度オフミ(オフライン・ミーティング)がある。
今まで何度もあったが私は参加したことがなかった。今回は、海外から共同購入した部品の受け渡しがあるので参加する予定。まとめて買うと安いので、幹事の人がまとめて発注し、オフミで受け渡されるというシステム。
私はテールライト・レンズを注文している。気合いの入った人たちは、足回りとかエンジン関連の部品も注文し、自分で交換するようだが、私は簡単なものしか交換できない。整備とかもディーラまかせ。
最近は、タイヤとホイールを交換したいと思うようになってきた。ショックとスプリングもできれば換えたい。
こうやっていくと、また「買いたいものリスト」が増えるので、またしばらく悩む。
1998年3月25日(水曜日)
A社から本が届いた。このあいだ私が下訳をして「できが悪い」と言われた本だ。もうすぐ書店にも並ぶ。
最後の「謝辞」のところに私の名前も書かれているのが、ちょっとはずかしい。訳のできが良かったのであれば、いいのだけれど...
ま、失敗は成功のもと、ということで…。今回のことは忘れることにする。
1998年3月24日(火曜日)
今日は久々に翻訳がない平和な日だ。平和な日は長ければ長いほどよいという気もするが、平和な日が長すぎると平和ボケするので気をつけようっと。
1998年3月23日(月曜日)
翻訳を始めてから、わりとお金の管理をちゃんとするようになった。今まであまり金銭の出納帳みたいなのは付けたことがなかったが、翻訳の経費を記録しておく必要があるので、ついでに他のお金の出入りも記録するようになった。
記録していると無駄使いが一目瞭然となり、もったいない、という気になってくるから不思議。キャッシュカードで下ろした額も毎月まとめて、ひと月ごとの額がわかるようにしてある。
半年ぐらい前からインターネットバンキングも始めたので、自分の口座が自宅からチェックできるのでとても便利。(インターネットバンキング自体は無料)
今年はお金の管理だけでなく、まじめに領収書を集めて税金を減らそうと真剣に考えている。
ちょっと久しくいつもの美容院に行っていないが、税金ネタを集めに行こうかと思う(美容院の人が税金に詳しいんです)。
1998年3月22日(日曜日)
復活しました。みなさん、おさわがせしました。
どうも風邪をひいているにも関わらず出張したのがダメ押しとなったようだ。おかげで3日間ほど寝ていた。でも火曜日の「きらきらひかる」の最終回はしっかり見た。あぁ、よかった。
金曜日にはB社から新しい仕事が来たので、起きて訳している。B社からは、いつものように「できる分だけ選んでほしい」と言われたので、かなり弱気に、ちょっとだけ担当させてもらうことにした。A社から週刊の翻訳も来たが、これも今日納品し、B社の分はあとちょっと訳して明日納品。
それにしても、B社への納品が16日に完了していたので助かった。17日〜19日の仕事のない期間が、風邪でダウン中の期間と偶然重なってラッキー。19日納期の翻訳があったりしたら、クラクラしながら訳さないといけないところだった。危ない危ない。
まだ、咳、鼻水は出るものの70%は回復、といった感じです。
1998年3月17日(火曜日)
ダウン 2 日目。寝る。
1998年3月16日(月曜日)
風邪をひいて、ダウン。とりあえず寝る。