お客様の素早い設計とより早い製品化を実現する、技術情報と専門知識をご紹介します。
エッジ処理に自然言語の理解をもたらすVIT Speech to Intentにより、 IoT、産業、車載アプリケーションにおいてスマート機器との自然なインタラクションが実現
NXP (R)Semiconductorsはエッジ・コンピューティングを活用してローカルでの音声制御を可能にする自然言語理解エンジン「VIT Speech to Intent」を発表しました。VIT Speech to Intentはクラウドベースのシステムに匹敵する性能を持ちながらもクラウド接続を必要とせず、ユーザーのプライバシー強化をサポートします。VIT Speech to IntentはNXPの音声インテリジェント・テクノロジ(VIT)ソフトウェア・スイートの一部として、IoT、産業、車載アプリケーションにおけるスマート機器に対し、正確なコマンドや言い回しを記憶する必要がなく自然な対話で機器の操作を可能にします。
スマート・ホーム、スマート・ファクトリー、スマート・シティなどにおいて、音声はスマート・デバイスの主要なユーザーインターフェースのひとつとなっています。しかし、こうしたスマート・デバイスの多くは目的のアクションを実行するために正確な言い回しが必要とされ、ユーザーの音声をデバイスのアクションに変換する際にクラウド接続が欠かせません。VIT Speech to Intentが提供する自然言語理解では正確な言い回しもクラウド接続も必要とせず、デバイスがユーザーの意図を理解します。その結果、特にスマート・ホームや、ユーザーの手が塞がっている病院や工場のような場所において、新たなイノベーションの可能性が開かれます。MCUとMPUに最適化されたNXPのソフトウェアは、高度なAI駆動デバイスからVIT Speech to Intentを使用したコンテキスト・アウェアな音声コマンドに至るまで、音声中心デバイスの開発を容易にします。
「スマート・ホームをはじめとして、ユーザーのニーズを正確に予測し、自動化できるスマート・デバイスが普及する中、音声コマンドはユーザーが好みをデバイスに伝える有効な手段として注目されつつあります。VIT Speech to Intentは特定のキーワードに依存せずにスマート・デバイスとのシームレスな対話を可能にし、利便性と使いやすさの提供、複雑さの軽減、ユーザーのフラストレーションの緩和を実現します。さらに、スマート・ホームから自律型ホームへの移行も促進します。」
NXP Semiconductoers, 上級副社長 兼 セキュア・コネクテッド・エッジ担当ゼネラル・マネージャー Rafael Sotomayor
VIT Speech to Intentエンジンはメモリのフットプリントが小さく、コンピューティング要件が高くないため、i.MX RTクロスオーバーMCU、RW61x MCU、i.MX 8M Mini、i.MX 8M Plus、i.MX 9xアプリケーション・プロセッサなどのNXPデバイスでの使用に適しています。また、VIT Speech to Intentエンジンはローカルで動作するため、クラウド接続の必要がなく、ユーザーのプライバシーの向上、レイテンシの低減、消費電力の削減、コストの削減につながります。そのため、スマート・ウォッチやスマートHVACなど、さまざまなアプリケーションにおける自然な音声インターフェースのサポートに使用可能です。
現在、VIT Speech to Intentは英語でのインタラクションをサポートしており、今年後半には北京語もサポートする予定です。2024年にはスペイン語、ドイツ語、韓国語、フランス語、日本語の追加サポートが予定されています。
MCUXpresso SDKとオンラインモデル・ツールから無料のVIT Wake WordエンジンとVoice Commandエンジンが利用可能で、デベロッパーはNXPのVoice Intelligent Technologyポートフォリオですぐに開発に着手できます。自然言語理解機能を必要とするアプリケーションの開発にはぜひVIT Speech to Intentをご利用ください。詳しくは営業所にお問い合わせいただくか、NXP.com/SpeechToIntentをご覧ください。
VIT Speech to Intentは、非常に包括的なローカル音声制御ソフトウェア・パッケージである音声インテリジェント・テクノロジ(VIT)ソフトウェア・スイートの一部です。先進的なディープ・ラーニング(深層学習)をベースとするVITは常時動作するWake Wordエンジン、Voice Commandエンジン、Speech to Intentエンジンで構成されています。デベロッパーはすぐに利用可能な無料のWake WordエンジンとVoice Commandエンジンを使って開発に着手できます。これらのエンジンはMCUXpresso SDKから入手でき、オンラインのモデル作成ツールでサポートされています。さらに、デベロッパーは新しくリリースされたSpeech to Intentエンジンにアップグレードすることも可能です。
NXP Semiconductors N.V. (NASDAQ: NXPI)には、より良く、安全・安心なコネクテッド・ワールドを実現する画期的なテクノロジを生み出すために優秀な頭脳がそろっています。組み込みアプリケーション向けのセキュアなコネクティビティ・ソリューションで世界をリードするNXPは、オートモーティブ、インダストリアル& IoT、モバイル、通信インフラの各市場で新たな可能性を拓く一方、より持続可能な未来を実現するソリューションを提供しています。60年以上にわたって蓄積した経験と技術を活かし、NXPは世界30か国強で約3万4,500名の従業員を擁しています。2022年の売上高は132億1,000万米ドルでした。詳細はWebサイトwww.nxp.comをご覧ください。
NXP、NXPロゴはNXP B.Vの商標です。他の製品名、サービス名は、それぞれの所有者に帰属します。All rights reserved. © 2023 NXP B.V.
タグ: インダストリアル&IoT