米国出願の拒絶理由通知を、日本語に翻訳できないか色々試してみました。

 米国出願の拒絶理由通知を、日本語に翻訳できないか色々試してみました。いや、英語を勉強しろとか、原文を読まないとダメとか、当然の意見はあるとは思うのですが。。

 とりあえず、目の前に米国出願の拒絶理由通知があるような状況だと、まずざっと内容を理解する必要があります。この辺りも概要はともかく、具体的な内容を理解しようとすると、うちでは結構時間が経ってしまうので困っていました。

 もちろん、最終的には、原文突合せで読むことになるんですが。今回は、いわゆる悪あがきの履歴メモです。

 まずは、一番ありそうなルートとして、USPTO(米国特許庁)のサイトから翻訳できないかを試してみました。USPTOのサイト自体が翻訳機能を持っていても、包袋(拒絶理由通知とかの書類一式)がHtmlで表示されれば、そのままブラウザのChromの翻訳機能が使えるからですね。ちなみに、紙での拒絶理由通知は、代理人から送られてきていますが、最低限データ化しないと翻訳にかけられないという理由です。

 早速試してみたところ、まず包袋を取り出すのに大苦戦しました。このインターネット全盛時代なのに、この使いにくさは、一体どうなってんのか。まず遭遇した問題は、該当する出願をApplicationNum(以下出願番号)で検索しようとすると、エラーが返ってくることでした。

 検索画面の検索キーワード種別の選択欄に出願番号があり、前記の別途紙で届いた拒絶理由通知の表紙にも出願番号があったのでそのまま入力してみました。すると、なぜか、謎のエラーの嵐。とりあえず、フォーマットが違うのか、単に混んでいて遅いのか、全く進みません。念のため、他の案件の出願番号を入力してみたのですが、そちらでも同じ状況になりました。てか、この国の公報、似たようなフォーマットの番号多すぎ。

 いきなりあまりに困ったので、ちょっと聞いてみたところ、PublicationNum(以下公開番号)の方が出やすいよ、とのことでした。なんでだよ。というのも、公開番号は、なぜか紙の拒絶理由通知には記載されていないので、一旦出願番号で公報を検索してから、公開番号を調べる必要があるためです。

 仕方がないので公開番号を調べ、検索キーワード種別の選択欄を公開番号にチェックして、検索欄に公開番号を入れてみます。すると、そちらで入れてみてもエラー。なんでだよーー。この辺りでもう心が折れかけたのですが、よくヘルプを見ると、もの凄い不親切な仕様になっていることが分かりました。

公報の公開番号記載形式:2020/*******
入力欄の入力規則:2020-*******

 間違い探しかよ。
 とりあえずこの形式で入力すると、かなり時間はかかるものの、結果が表示されました。上の方のタブのImage File Wrapperってところをクリックすると、包袋リストが表示されます。よく見ると、弁理士会のどっかの研修で見たやつですね。

 ・・・が、ここで予想しなかった問題が発生します。日本のJプラットパットの場合は、Webページで表示されるのですが、なぜかUSPTOの場合は、全部PDFで表示されるのです。このパターンだと、Chromの翻訳機能は使えないんですね。Webページ内を探してみたのですが、翻訳ボタンのようなものもありません。泣く泣く、その場は、とりあえず公報のPDFファイルをダウンロードしました。

 次は、とりあえず公報の英文のPDFファイルが入手できたので、google翻訳にかけてみることにしました。さすがに1文づつコピペは大変なので、ファイルごと取り込ませて翻訳するモードで実行してみます。結果は、ダメでした。一応1文づつコピペする方式でも試してみたのですが、そこで恐ろしい問題が発覚したのです。

 なんと、USPTOのファイルはOCR(文字情報付加)されていない感じなのです。とりあえず、開いたPDF上では、マウスで何文字か選択してみようと思ったのですが、全部領域指定になります。全部画像形式のPDFの時の動作ですね。これだと検索もできなくて、情報的にほぼ死んでしまうと思うのですが、正気かUSPTO。

 そろそろ、こんなことやってる間に、辞書を眺めながら読み始めた方が早そうな気がしてきたのですが。米国がダメなら、JPO(日本特許庁)でできないか調べてみることにしました。とりあえず、Jプラットパットは、US公報の番号を受け付けてくれるので、入力してみることにします。すると、米国公報の抄録が表示されました。抄録は、英語の公報の内容をざっくり人力で英語に翻訳したもののようです。内容的にはちゃんと読めますが、問題は、拒絶理由通知等へのリンクは当然ありませんでした。まあ、無料ですしね。

 一応、一縷の望みをかけて、goolgeパテントも試してみました。こちらは結構快適に公開公報を検索することが出来、Chromの翻訳機能で、そのまま結構精度の高い日本語で読むことが出来ました。まあ、公報自体は、日本に出しているファミリー出願をひっかければ大差ない内容が出てくるので、参考という意味ではほとんど意味がないのですが。しかし、JPOと同じで、拒絶理由通知等へのリンクはありません。

 万 策 尽 き た 。

 万策尽きたので、せめてこれまでの問題点を纏めてみました。
 1.Chromの翻訳は、テキストデータになっていないと利用できない
 2.USPTOのPubilcpairから取り出せるのは、OCRされていない画像形式のPDFのみ
 つまり、画像形式のPDFを無理やりテキスト化すれば、翻訳できるのではないでしょうか。

 そんな訳で、以下が米国出願の拒絶理由通知を、日本語に翻訳できないかに対する答えです。まずは、とりあえず、PDFに文字情報を付加してあげる必要があります。TXT等の文字情報ファイルに変換する方法としては、いくつかあるようですが、元々文字情報がついていないPDFが変換できるかは微妙だったので、今回は、フリーソフトや、有料プランでないと対応していないAcrobatReaderはとりあえず候補から外します。

 ものすごい力業としては、いま手元にある紙の公報をOCR対応のスキャナで取り込み直しても良いと思います。しかし、紙レス化が叫ばれる状況ではあまりに悲しいので、今回は、ITに頼ってみました。

 具体的には、先ほど落としてきた英文のPDFファイルを、一旦googleドライブで保存します。そのまま、保存したファイルは、googleドライブ上でブラウザーからgoogleドキュメントとして開きます。この時点で、開いたファイルは、なぜかOCRのないPDFファイルでも、文字情報として変換されます。なぜなのか。

 これで文字情報に変換されたので、開いたファイルは、メニューからgoogleドキュメントで開いているファイルをTXTファイルで出力します。googleドキュメント自体にも翻訳機能がついているのですが、いまいちだったので今回は止めました。またDoc等の形式でも出力できるのですが、こちらも、あまりに見ずらいのでこちらも辞めました。

 最後に、前記のgoogle翻訳に、先ほど出力した英文のTXTファイルを読み込ませます。すると、チェックシート形式のところはともかく、後半の詳細拒絶理由の記載されている辺りは、そこそこ読めそうな感じで日本語化されて表示させることが出来ます。ちなみに、google翻訳の翻訳は、googleドキュメントの翻訳エンジンとはバージョンが違うのか、こちらの方がまだ読みやすい感じで出力されました。謎ですね。

 まあ、それでも、ようやくできた翻訳は、googleパテント並みの翻訳精度はないのですが、ざっくり内容を把握するには十分使えると思います。英語が超嫌いなんだけど、なぜか仕事で割り当てられるなんて方は、参考にしてみてください。まあ、最終的には原文なのですけど・・・。

The following two tabs change content below.
とある企業の知財部で働く一応弁理士です。 国内特許系メインの日々の業務とか、試験対策ネタとか書いています。 受験時代は某L社系列の某B,M講師をメインに習っていました。 Copyright (C) 2010 - 2017 SQUARE ENIX CO., LTD. All Rights Reserved.

最新記事 by kuroneko (全て見る)

シェアする

  • このエントリーをはてなブックマークに追加

フォローする