コンピューター・ビジョン AI

コンピューター・ビジョン AI の要点

コンピューター・ビジョンは、コンピューターとシステムが、画像と映像データから得られるインサイトに基づいて行動することを可能にする、AI の一種です。
組織は、コンピューター・ビジョンをさまざまなユースケースに適用し、オートメーション、効率化、価値の向上を実現しています。
インテルは、パワフルなオープンソース・ソフトウェア・ツールを提供し、開発者やデータ・サイエンティストが、分散システムと異種アーキテクチャー間での導入を保護し、簡素化するのに役立ちます。
コンピューター・ビジョンのイニシアチブに適したハードウェアを選択するには、いくつかの要因について検討が必要です。本記事では、3 つの主要なエッジ・ユースケース向けに、ハードウェアの推奨事項を提供しています。

投稿者:

コンピューター・ビジョン AI は、複数のビジュアル・タッチポイントから収集されたデータから得られる重要なインサイトに基づいて行動するよう、コンピューターをトレーニングしてビジネスを支援します。推論モデルのトレーニングと導入を成功させるには、ユースケースの需要に応じた、ハードウェアとソフトウェアの適切な組み合わせが必要となります。

コンピューター・ビジョンの概要

あらゆる企業は、卓越した顧客体験の提供から生産ラインのインピーダンスの排除まで、競争力のある差別化を図るために、ビジネス、ブランド、プロセスの改善に努めています。しかし、こうした改善が必要な地点とタイミングの特定は、人力では不可能です。人工知能 (AI) の一種であるコンピューター・ビジョン・テクノロジーは、複数のタッチポイントからビジネスを監視し、収集された膨大な量のビジュアルデータを把握するためにコンピューターをトレーニングする組織で使用されています。

コンピューター・ビジョン AI は、画像や動画の特定の部分を認識し、それらに関する予測を行うようシステムをトレーニングする目的で使用されるカメラ、エッジ・コンピューティング、クラウド・ベースのコンピューティング、ソフトウェアおよびディープラーニング・モデルなど、カメラやビデオから収集されたデータを「見る」ことを可能にする、さまざまなコンポーネントを組み合わせたものです。コンピューター・ビジョン・モデルには、次の種類があります。

画像分類: 画像を検査して、その内容に基づいてクラスラベルを割り当てます。例えば、画像分類モデルを使用して、どの画像に犬、猫、怒っている顧客が含まれているかを予測することができます。
画像セグメンテーション: X 線検査で周囲の脳組織から腫瘍を判別するなど、物体を識別して背景から抽出します。
物体検出: 画像や動画をスキャンして対象物を見つけます。物体検出モデルは、一般的に複数の物体を同時に強調表示します。在庫管理を改善するため棚にある商品を識別したり、生産ライン上のアイテムの異常を識別したりといったタスクに使用できます。
特徴抽出: 画像や動画でキャプチャされた有用な特徴を分離し、検索や画像マッチングなど、2 番目の AI アルゴリズムでそれらの特徴を共有します。例えば、特徴抽出は、交通監視や事故検知を自動化するために使用できます。

コンピューター・ビジョンは、広範囲にわたる新しいユースケースを可能にし、さまざまな業界の企業が運用コストを削減し、ビジネス・オートメーションを実現し、新しいサービスや収益源を生み出すのに役立っています。ここでは、ほんの一例をご紹介します:

医療用画像処理: GE Healthcare 社は、コンピューター・ビジョン AI アルゴリズムを使用して、気胸という重篤な肺疾患など、胸部レントゲン撮影で重大な所見を検出するアプリケーションを発表しました。
スマートリテール・ストア・ソリューション: 小売店の陳列棚を監視するスマートカメラが、在庫データを追跡し、特定の商品の在庫がなくなったら、直ちにスタッフに通知します。デジタルサイネージに組み込まれたコンピューター・ビジョンでは、小売業者が、どのタイプの顧客がどのマーケティング・メッセージを見たかを測定し、店舗で店内のサイネージの効果を改善することができます。食料品店チェーンの Town Talk Foods は、AI ビデオ分析を使用して、マーケティング、オペレーション、マーチャンダイジングを最適化し、年間販売目標を 17% 早く達成しました¹。
アスリート動作トラッキング: インテルは、携帯電話で撮影されたアスリートのビデオをスキャンし、そのフォームと動きに関する重要な情報を抽出し、アスリート本人とコーチが適切な調整を行うよう支援する AI プラットフォームを開発しました。

コンピューター・ビジョン・アプリケーションに最適なハードウェアとソフトウェア・テクノロジーを特定する

変革的なコンピューター・ビジョンの利点を前提として、多くの企業が複数の事業領域で、このテクノロジーを活用しようとしています。コンピューター・ビジョン・ソリューションの導入には、コンピューター・ビジョン AI モデルのトレーニングまたは微調整、高度な機能を実現するためのデータの供給、AI ビジョンのワークロードを必要とされる場所に導入することが求められます。

結局のところ、インパクトがあり、費用効果が高く、スケーラブルなコンピューター・ビジョン・ソリューションを実現するには、ビジネスとテクノロジーの要件に基づいて慎重に選択された AI ハードウェアとソフトウェア・ツールの最適な組み合わせが必要となります。インテルのポートフォリオを使用して、ビジネス要件を満たしながら、事実上あらゆるコンピューター・ビジョンのユースケースのニーズを満たす方法について検討してみましょう。

インテルのツールと最適化により開発とデータサイエンスを加速する

コンピューター・ビジョンの導入は、開発者とデータ・サイエンティストにかなりの負担が強いる可能性があります。モデル開発と導入を合理化し、パフォーマンスを最適化するために、インテルは、TensorFlow、PyTorch、scikit-learn など、人気の高いフレームワークの最適化を含む、エンドツーエンドの AI パイプライン・ソフトウェアを提供しています。

さらに、インテル® ディストリビューションの OpenVINO™ ツールキットなど、導入を大幅に簡素化する開発者向けリソースもあります。これによりチームは AI ソリューションのコードを一度記述するだけで、事実上どこにでもデプロイできるようになります。オープンソース・フレームワークである OpenVINO™ により、ベンダーロックインを回避し、エッジからクラウドまでの異種ハードウェア間で、シームレスに拡張できるアプリケーションを構築できます。

価値創出の迅速化をさらに容易にするために、インテルはオープンソースで、エンタープライズ・クラスのコンピューター・ビジョン・プラットフォームであるインテル® Geti™ の開発も率先しています。これにより、ノンコーダー分野のエキスパートがデータ・サイエンティストと協力して、AI モデルを迅速に構築し、トレーニングできるようになります。

インテルの幅広いハードウェアのポートフォリオと組み合わせることで、インテルのオープン・ソフトウェア・ツールは、求められるパフォーマンスを確保して ROI を加速させる一方で、コンセプトから本番環境までの AI の取り組みを合理化できます。組み合わされたインテル® AI コンピューター・ビジョン・プラットフォームのパワーにより、AI パイプラインのあらゆる側面に、自信を持って取り組むことができます。

こちらをクリックして、インテルのデータサイエンスおよび開発者ツールの全ポートフォリオをご覧ください。

モデルのトレーニングと導入: ニーズに合わせて最適化されたハードウェアを選択する

コンピューター・ビジョンのアプリケーションは多岐にわたるため、解決しようとしている問題、データのトレーニングと分析を行う場所、ワークロードの規模に応じて、インフラストラクチャーのニーズは大きく異なります。このセクションでは、ユースケースに最適なハードウェアを選択する際に考慮すべき 3 つのポイントについて説明します。

検討事項 1: コンピューター・ビジョン・モデルのトレーニングがどこで行われるか

トレーニングのワークロードに最適なハードウェアを特定するには、まず、その AI の戦略とユースケースで、モデルのトレーニングや微調整の機能を、エッジ、クラウドおよびデータセンターのいずれか、または両方に配置する必要があるかを検討します。コストまたはセキュリティーの制約により、クラウドでデータをトレーニングできない場合もあります。さらに、自社エッジサーバーで利用可能なオフピーク・サイクルを活用して、データの生成場所でそのままトレーニングを実行することも可能です。

モデルの微調整など、エッジでの軽量のトレーニングには、インテル® データセンター GPU を搭載したサーバークラスのインテル® Xeon® スケーラブル・プロセッサーをお勧めします。

大規模なデータセットのトレーニングまたは導入の場合、あるいはモデルをエッジで迅速にトレーニングする必要がある場合、そのワークロードには、追加のインフラストラクチャーまたはクラウドベースのトレーニングと推論が必要になることがあります。そのような場合、AI ワークロードをオンプレミスのサーバーと組み合わせて、分散トレーニング・モデルを検討することをお勧めします。内蔵 AI アクセラレーションを備えたインテル® Xeon® スケーラブル・プロセッサー・ファミリーを複数使用すると、GPU に依存することなく、効率的でコスト効率に優れたトレーニングを実現できます。

非常に大規模なワークロードの場合、Habana® Gaudi® またはインテル® データセンター GPU フレックス 140 または 170 などのディスクリート・データセンター GPU を使用した、高度なディープラーニング・アクセラレーターのアプローチを採用することも可能です。

例えば、自動運転車の Mobileye アプリケーションは、歩行者、その他の車両、交通信号を検出し、対応するために、コンピューター・ビジョンを使用しています。そのため、アプリケーションは毎秒数百枚の画像を処理し、大量のモデルを継続的に実行する必要があり、トレーニングが運用コストの主な要因となります。トレーニング効率を高めるため、Mobileye は、Habana® Gaudi® を使用して、クラウド上でモデルをトレーニングし、価格対性能比を最大 40% 向上させました²。

モデル・トレーニングの詳細については、こちらをご覧ください。

検討事項 2: 導入に堅牢なフォームファクターが必要か

コンピューター・ビジョン・ソリューションのハードウェアを選択する際、もうひとつの重要な検討事項は、従来の IT 環境に導入するのか、環境面で独自の課題がある場所に導入するのかです。産業用工場のフロア、倉庫、基地局、船舶などの厳しい環境では、ほこり、振動、極端な温度、その他の過酷な条件からの保護を提供する、頑丈なデバイスが必要です。インテルは、より高いスループットを必要とする標準的な環境およびワークロード向けの汎用サーバー CPU だけでなく、堅牢な小型フォームファクターのデバイス向けに、GPU を内蔵した IoT 用プロセッサーおよび組み込みプロセッサーも提供しています。

検討事項 3: 運用中にエッジでビデオデータを分析して処理する必要があるか

大量の画像や動画データを処理する必要がある場合、データをクラウドにアップロードするにはコストがかかりすぎる、あるいは規制やセキュリティーの要件により、クラウドにデータを送信できない場合があります。また、クラウドでの処理を禁止する、レイテンシーの要件にも直面する可能性があります。さらに、クラウドにアクセスできないときはエッジでモデルの処理を続けることが必要になったり、モデルによるデータの分析と応答を高速にすることが必要だったりします。

これらの懸念のいずれかに対応するためにエッジでの処理が必要な場合、オンボード・エッジ・デバイスまたは汎用 IoT デバイス、デバイスエッジのビデオ AI ボックス、オンプレミスのエッジビデオ AI サーバーの 3 種類のソリューションのいずれかが求められる可能性が高くなります。

ユースケース: 低レイテンシーの導入向けのオンボード・エッジ・デバイスまたは汎用 IoT デバイス

コンピューター・ビジョン・テクノロジーは、一般的に、ドローン、ロボットアーム、スマートカメラなどのエッジまたは IoT デバイスに組み込まれています。このような導入は、自律的でスペースまたは電力に制限があるか、AI のレイテンシーを可能な限り低く抑える必要があります。インテルは、エッジデバイスや組込みデバイスの多様な要件や制約を満たす、専用設計の低消費電力の製品を提供しています。

ワークロードの複雑さに応じて、次のいずれかのハードウェアの組み合わせを検討してください。

超低消費電力アクセラレーター向けのインテル® ガウス & ニューラル・アクセラレーター (インテル® GNA) などの内蔵アクセラレーション機能と、統合型 GPU を備えたインテル® Core™ プロセッサー・ファミリー
インテル® Core™ プロセッサー・ファミリーとインテル® Iris® X^e グラフィックスのディスクリート GPU または統合型 GPU
インテル® Xeon® D プロセッサー・ファミリー、統合されたインテル® アドバンスト・ベクトル・エクステンション 512 (インテル® AVX-512) アクセラレーションとディスクリート GPU を追加搭載

インテルのハードウェア上に構築されたコンピューター・ビジョン・アプリケーションが、照明メーカーである Signify 社の製品ラインの品質管理の合理化に、どのように役立ったのかをご覧ください。

ユースケース: 中程度に複雑な導入向けのデバイスエッジのビデオ AI ボックス

デバイスエッジのビデオ AI ボックスの導入では、少数のカメラ (およそ 4 台から 10 台) が、オンボード AI 処理用の単一のアプリケーションに直接接続またはストリーミングされます。例えば、小売店のセルフレジのコンピューター・ビジョン・アプリケーションは、複数のセンサーを使用して、顧客が購入している製品を識別し、より迅速な精算処理の実現と、店舗における万引き防止に役立っています。必要なカメラのストリームが少ないため、このような導入は、低消費電力のプロセッサーの使用を通じて、効果的にサポートすることができます。

使用環境に存在するほこり、油脂、その他の汚染物質からの保護が必要な場合、開放型のシャーシファンではなく、パッシブ冷却または外部冷却を備えた Semi-Rugged または Fully Rugged のハードウェアをお勧めします。

あらゆる環境における小規模から中規模に複雑なワークロードと導入の場合:

超低消費電力アクセラレーター向けのインテル® ガウス & ニューラル・アクセラレーター (インテル® GNA) などの内蔵アクセラレーション機能と、統合型 GPU を備えたインテル® Core™ プロセッサー・ファミリー

中規模から大規模に複雑なワークロード、標準的な IT 環境での導入、Semi-Rugged 設計を必要とする環境では、以下の追加オプションを検討してください。

インテル® Core™ プロセッサー・ファミリーと、インテル® Arc™ グラフィックスなどのディスクリート GPU
IoT エッジ向け第 4 世代インテル® Xeon® スケーラブル・プロセッサー・ファミリー、インテル® アドバンスト・マトリクス・エクステンション (インテル® AMX) の内蔵アクセラレーションと、インテル® データセンター GPU フレックス 140 または 170 などのディスクリート・データセンター GPU を搭載

インテルのコンピューター・ビジョン・ソリューションが、小売業者がデータをリアルタイムでインサイトに変換するのを支援している方法について、詳細をご覧ください。

ユースケース: 高度な導入におけるオンプレミスのエッジビデオ AI サーバー

コンピューター・ビジョン AI アルゴリズムを適用して、X 線画像から疾患を検出する医療用画像処理アプリケーションといった、一部の高度なユースケースの場合、多数のリモートカメラ（場合によっては 300 台以上) を導入し、AI 処理用の単一のオンプレミスのデバイスにストリーミングすることがあります。このような導入では、多数のカメラをサポートし、複数のコンピューター・ビジョン・モデルを実行する場合があるため、大きな処理能力を提供するハードウェアを検討する必要があります。

環境条件も考慮する必要があります。ビデオ AI サーバーが標準的な IT 環境に設置される場合、標準的なデータセンター・サーバーまたはエンタープライズ・ワークステーションに適したハードウェアを選択できます。ただし、過酷な条件の環境では、堅牢なモジュラーサーバーが必要です。

標準的な IT 環境に導入する場合、ワークロードに応じて、以下のハードウェアを検討してください。

第 4世代インテル® Xeon® スケーラブル・プロセッサー
第 12 世代インテル® Core™ プロセッサー・ファミリーとサードパーティーのアクセラレーター
第 4 世代インテル® Xeon® スケーラブル・プロセッサー・ファミリーと、インテル® データセンター GPU フレックス 140 または 170 などのディスクリート・データセンター GPU

導入に堅牢な設計が必要な場合、ワークロードに応じて、次のハードウェアを検討してください。

IoT エッジ向け第 4世代インテル® Xeon® スケーラブル・プロセッサー
第 4 世代インテル® Xeon® スケーラブル・プロセッサー・ファミリーと、インテル® データセンター GPU フレックス 140 または 170 などのディスクリート・データセンター GPU

Hellometer のコンピューター・ビジョンベースのレストラン・オートメーション・ソリューションが、どのようにブランドのドライブスルー体験の向上に役立っているかをご覧ください。内蔵 AI アクセラレーションと OpenVINO™ ソフトウェアを備えたノートブック PC 向けインテル® Core™ プロセッサー・ファミリーを使用し、Hellometer は、レストラン経営者がサービス提供速度を平均 47 秒向上させることを可能にします。これは、1 店舗あたり年間 130,000 米ドルの収益増加に相当します³。

インテル® Vision Solutions で将来を見据えたコンピューター・ビジョン・アプリケーションを構築する

インテルは、幅広いハードウェア・ポートフォリオとエンドツーエンドの AI パイプライン・ソフトウェア・ツールを提供し、パフォーマンスとコストの適切なバランスを備えたコンピューター・ビジョン・アプリケーションの構築をサポートします。多岐にわたるハードウェアのオプションでは、あらゆる環境でのコンピューター・ビジョン導入に必要な処理能力が得られます。とりわけ、開発者とデータ・サイエンティストは、インテル® ディストリビューションの OpenVINO™ ツールキットなどのオープンソースのソフトウェア・ツールを使用して、異種デバイス間で容易に拡張できるアプリケーションを開発および最適化できます。コードを数行変更することで、数千のディープラーニング・アクセラレーターでトレーニングされたコンピューター・ビジョン AI モデルを、ドローン上で動作させることができます。

導入のあらゆる段階で、あらゆる規模の AI を支援するインテルのソリューションをご覧ください。

コンピューター・ビジョン・ソリューションに適したインテル® Vision Portfolio について詳しく調べる

コンピューター・ビジョンのリソース

AI 対応ソリューションからより多くの価値を引き出す方法に関する専門知識とガイダンスをご覧ください。

業界をリードするテクノロジーの活用を通じて、企業は AI を迅速にスケールアップできます。

インテル® AI のホームページにアクセス

生成 AI は、テキスト、動画、音楽、コードなど新しいコンテンツを作成できるほど高度です。

記事を読む

どのインテルのテクノロジーを組み合わせることで、レコメンデーション・システムの課題を克服できるかをご覧ください。

記事を読む

生成 AI や LLM が登場する前は、古典的機械学習がデータをインサイトに変える支援をしていました。

記事を読む

AI ワークロード向けに構築されたハードウェアで、現実の課題を解決できます。

インテル® AI ハードウェアのページにアクセス

適切なソフトウェア・ツールを使用することで、データサイエンスのハードルを克服できます。

インテル® AI ソフトウェアのページにアクセス

それぞれの業界に適した特定の AI ソリューションにより、低リスクかつ高価値な導入を実現します。

AI のユースケースを参照する

もっと見る表示件数を減らす

よくある質問 (FAQ)

よくある質問

コンピューター・ビジョンは、コンピューターが画像や映像から収集されたデータを「見る」ことを可能にする AI の一種です。コンピューター・ビジョンのアプリケーションを使用することで、企業はビジネスのさまざまな側面を監視し、コンピューターが見たものに反応できるようトレーニングできるので、従来は不可能だった方法でビジネスの一部を自動化することが可能になります。

コンピューター・ビジョンは、カメラ、エッジ・コンピューティング、ソフトウェア、AI を組み合わせることで、システムが画像分類や物体検出などのタスクを実行できるようにします。コンピューター・ビジョンのアプリケーションは、ディープラーニングを使用して、画像や動画の特定の側面を認識し、それに関する予測をするよう、コンピューターに学習させます。

言語の選択

Intel.com サーチを使用

クイックリンク

最近の検索

高度検索

検索のみ

コンピューター・ビジョン AI: 新しい方法でデータを確認することで、オートメーションと効率の向上を実現