ビンビン

Microsoft Research は、「スマート」キャプションを自動的に生成できるシステムを作成します

目次:

Anonim

確かに、紛らわしい、間違っている、または参照している画像についてほとんど説明していないキャプションに出くわしたことがあります。また、自分の記事を公開することに専念している場合、このセクションに記入するのが最も退屈なであることに気付く可能性さえあります.さて、レドモンドの人々は、物事を簡単にすることを目的としたツールを作成しました.

Microsoft Research によって発表された作品で、人間の言語の物語の特徴を模倣できる「キャプション生成システム」、つまりスクリーンショットを私たちの 1 人であるかのように説明できる技術であると自称しています。対応するコンテキストで。Facebook、Microsoft、Google などの企業が以前から取り組んできたことですが、今回は期待を超えています。

それは何で構成されていますか

彼は素晴らしい時間を過ごしました

このように、システムには、いくつかの画像から完全なストーリーを伝える能力さえあり、それを説明し、まるでそうであるかのように伝えます。それは本でした。専門家によると、このユーティリティは、特定のアプリケーション、音声認識アプリケーション、他の領域での説明の自動生成などに、より人間味のある機能を提供する機能になる可能性があります。

そして、tool は、「見ている」ものを簡潔に言うことに限定されず、より広い範囲を提供します。この作品の著者の一人であるフランク・フェラーロは、「物語の文脈と独特のスタイルの物語」を実現するために、画像に反映される状況の文脈を説明しました。状況に身を置くために、彼は私たちに明確な example を与えます

彼の母親は彼を誇りに思っていました

したがって、私たちは 提案します 次のケースを考えてみましょう。パブ。最初の画像にはビールを注文して飲んでいる人が写っていますが、最後の画像にはソファで眠っている人が写っています」と彼はコメントしています。

従来のシステムは、「ソファに横になっている人がいるような何かを単に指し示すことができますが、私たちのシステムは、数杯飲んだ後に酔っているためにおそらくそのような状況にあると含めることができます」 . 理解を提供する追加と、この記事に含まれる画像や写真のキャプションにも反映されている特定の感情的な負担.

Via | MITテクノロジーレビュー

ザタカ Windows |マイクロソフトは、あなたの犬の品種を決定するアプリを起動します

ビンビン

エディタの選択

Back to top button