セマンティック・ギャップ

semantic gap


セマンティック(semantic)とは、言語学的にいう意味論のことで、本来は「語義の隔たり」という意味があり、CPUの開発で、プログラミング言語はどんどんと高級化し、プログラミング言語とプロセッサの命令とは大きくかけ離れてしまい、CISCでは、その隔たりがプログラミングを困難にするのではないかという考えから、プログラミング言語とそれを実行するプロセッサとの間の命令の隔たりという意味に使われるようになった。
その問題を解決する目的として、RISCはCISCを駆逐できるひとつになりえることから、RISCの開発が盛んになった。しかし、その後Intel社のクロック競争に巻き込まれたサン・マイクロシステムズ(Sun Microsystems)社のスパーク(SPARC)、ヒューレット・パッカード(Hewlett-Packard/HP)社のPA-RISC、ミップス(MIPS)社のMIPS、米国のDEC(デック/Digital Equipment Corporation)社のAlpha、モトローラ(Motorola)社のPowerPCなどのRISC陣営は、CISCに追い詰められ、Hewlett-Packard社のPA-RISCやAlphaを採用したコンピュータ製品群は、Itaniumプロセッサ・ファミリ(IPF)へと統合されることになり、Sun Microsystems社もIPFのサポートを開始する動き出すようになっている。
ただし、この動きはIntel社の営業作戦に追い立てられ、経営的な問題が表面化したのであり、モトローラ(Motorola)社やIBMのPowerPC、日立製作所のSuperH(SH/SuperH RISC engineファミリ)などは健在である。
VNUnet UKは2007年10月18日に、ほとんど知られていない「Google Labsウィジェット(Google Labs widget)」をUCSD(UCサンディエゴ/UC San Diego)とUCLAからの研究者が、コンピュータの「常識(common sense)」に加えたと報告した。つまりこれは、コンピュータ科学者がシステムをラベル化しながら自動映像による写真で物を特定するのを助け、文脈を使用する能力を加えたことになった。
「セマンティック」の世界で、「Google Labsウィジェット(Google Labs widget)」の「Google Sets」が画像検索で利用できることをコンピュータ科学者に承認された。「意味(セマンティック/Semantic)」を理解するコンピュータの世界へ、「Google Sets」で本格的に突入することが可能であることを実証したことになった。例えば、従来の自動化された物の識別子はイメージをスキャンして、「人」「テニスラケット」「テニスコート」、および「レモン」を特定した場合、新しい後工程文脈チェックは「テニスボール」として「レモン」を再ラベルする。UCサンディエゴのコンピュータ・サイエンス学科Serge Belongie教授は、「私たちは、私たちの論文が外部の意味関係を物体認識の問題にもたらす最初であると思います。」と、言った。
研究者は、外部の文脈上の情報を自動化された物の識別子に提供するのに「Google Sets」を使用することができることを示した。「Google Sets」はわずかいくつかの例から関連する項目か物のリストを発生させることが可能であることを証明した。例えばユーザーが「ジョン」「ポール」、および「ジョージ」をタイプすると、それは単語「リンゴ」「ビートルズ」、および「ジョン・レノン」と返してくる。同様に、「ネオン」と「アルゴン」をタイプすると、他の高貴なガスのリスト、「ヘリウム」「クリプトン」が発生して、「キセノン」は「ラドン」と返してくる。
Belongie教授は、「ある点では、Google Setsは常識のためのプロキシです。」と説明しました。「論文で私たちは、あなたがシステムをラベルする自動映像の精度を改良する文脈上の情報を提供するこの常識を使用することができることを示した。」システムをラベルするイメージは3ステップの過程で、まず第一に、自動化されたシステムは、イメージ分割を使用することでイメージを異なった領域に分ける。「テニス」の例では、イメージ分割として「人」「規則」「ラケット」および「黄色い球」に切り離す。次に、自動化されたシステムは、ありえそうなラベルの格付けされたリストをそれぞれこれらのイメージ領域に提供する。
最終的にシステムは、イメージの中でラベルのすべて異なった可能な組み合わせを処理して、各画像の中でラベルされた物の文脈上の規定を最大にすることによって、文脈の投与量を加える。このステップの間で、システムが「レモン」を「テニスボール」に変えることを助ける文脈の源として「Google Sets」を使用することができた。この場合「意味文脈規制(semantic context constraints)」が、システムは目視により同様の物の間であいまいさを除くことを支援した。これは、リオデジャネイロで開催された第11回IEEE国際会議で2007年10月18日に紹介された。詳細情報はURL(http://www.vnunet.com/vnunet/news/2201451/boffins-give-comptuers-common)で知ることができる。
「Google Sets」はURL(http://labs.google.com/sets)、論文はURL(http://www.cs.ucsd.edu/~sjb/iccv2007a.pdf)にある。
米国のセマンティック・サーチ・エンジンhakiaは2008年10月6日に、サイトの大幅なリニューアルを発表し、書やIT専門家の助けを借りて信頼できるWebサイトを区別し、情報を探しやすくする試みを開始したと報告した。 詳細情報はURL(http://blog.hakia.com/?p=453)で知ることができる。