人気ブログランキング | 話題のタグを見る

検索キーワードの使い方

前回、検索に使うキーワードの選定について書きましたが、今度は実際に検索式として使用する場合の注意点について書いてみたいと思います。

私のポリシーとして、許された予算や納期の範囲内で最善を尽くすのがプロサーチャーだ、というのがあります。これは逆にいえば「本調査では見つからなくても、それ以外の部分を探せばあるかもね」ということに他ならず、これがクライアントによってはなかなかご理解いただけないこともあります。そのお気持ちは、サーチャーとしてもよくわかるのですが。

というわけで、「探せばあるかもしれないけれど、可能性としては低いよね」という部分については、後回しになったり、結局調査対象から外したり、ということになります。誰だって金鉱を探すときには金が埋蔵されていそうなところから掘り進めるということです。が、これもお客様のご要望によって変わります。

「漏れがあってもいいから、有りそうなところだけチャチャッと見てくれる?」と仰るお客様。出願前新規性調査ならまだしも、侵害予防調査でこんなことを言われたらものすごく心配になってしまいますが、お客様にも事情がおありなのでしょう、できるだけのことは致します。

心配なのを除けば、調査としてはやりやすい調査と言えます。

反対に、「ノイズがどんなに多くなってもいいから、絶対に漏れが無いようにしてくれ」という検索を依頼される場合があったら、さて、どうしたらよいでしょう?とても目の細かいふるいを使って川砂をさらって、どんな小さな砂金つぶでも採集するというような検索です。

これはもう、その技術分野に該当する特許分類を調べて、その分類が付与されている出願全てを精読するしかないでしょう。(それでも絶対に漏れがないと言い切るのはムリです。分類付与が適切でない公報もあれば、サーチャーも人間なら精読漏れもあり得るからです。)そんなことをしたら時間も調査料もものすごくかかってしまいますが、どうしてもと言われればやります、お仕事ですから。

とはいっても、やはりそこまでの金額も時間もかけていられない場合がほとんどですから、相談しながら落としどころを探っていくことになるわけです。それでも、できる限り網羅的に拾いたいと仰るお客様。キーワードの選定が鍵になります。

このような場合、キーワードとしてどの語を選ぶか(制御、操作、コントロール等)、選んだキーワードの派生(?)(制御部、制御用、制御盤等)と並んで、マイナーだけれど無視できないのがキーワードの表記です。

キーワード検索を行う対象が、例えばPATOLISデータベースのパトリス抄録である場合は、この「表記」はあまり重要ではありません。何故ならば、パトリス抄録はPATOLISのプロデューサーでもありベンダーでもある(株)パトリスがマニュアルな作業によって作成している抄録だからです。フリーキーワード自体も、ある程度の統一が図られています。フリーキーワードの切り出しや分かち書きに間違いはあっても、それを考慮して検索せねばならない程ではありません。

しかし、全文検索となると違います。STNやDialog等、システムによって名称は違いますが、PCTFulltext、GBPatFulltext、FRPatFulltext等のデータベースは、紙発行の公報をスキャンしてOCR処理して全文データを持っています。当然、認識ミスがいっぱいです。「good」が「qood」になっていたりとか、「l(小文字エル)」と「I(大文字アイ)」と「1(数字イチ)」の混同、「O(大文字オー)」と「0(数字ゼロ)」の混同など。

日本語のデータベースも同様です。私が高頻度で使用するHYPAT-iデータベースは全文データをスキャン&OCRして持っているので、同じように認識ミスがあります。電子出願後の公報はともかく、昭和に発行された公報なんて、女子高生のケータイメールも真っ青です。濁点と半濁点の混同や、「ロ(カタカナ)」→「口(漢字)」→「□(四角記号)」、「タ(カタカナ)」→「夕(漢字)」、「カ(カタカナ)」→「力(漢字)」、「リ(カタカナ)」→「り(ひらがな)」等の混同は珍しくなく、「記」→「言己」「格」→「木各」等の標記になっていることもあります。

「ラ千ェッ├」、「〒-ハo-」「ハソ├``|レ」ときたらまさにギャル文字。組み合わせ自在、例を挙げたらキリがありません。

さすがにギャル文字を検索語として使用することはありませんが、何が何でも漏れを無くせと言われれば「コント□-ラ」「応カ」くらいは使用します。検索式を見て、「コントローラ+コント口-ラ+コント□ーラ+コソトロ一ラ+…」等と記載されていたら、サーチャーのささやかな努力の跡を認めてやってください。

ちなみに、HYPAT-iデータベースでは、請求の範囲だけは昭和61年以降のデータに限り、マニュアルにチェックされているので、こんな表記ゆれ(?)は考慮しなくても大丈夫です。

by hemp-vermilion | 2009-04-25 18:31 | 特許サーチ

<< とうとう手に入れた…! 検索キーワードの選び方 >>