コンテンツにスキップ

OCRText

OCRTextコンポーネントは画像からテキストを抽出します。

OCRTextコンポーネントのタイトルバーをダブルクリックし、OCR Settingsウィンドウを起動します。

  1. Engine(OCRエンジン): Intellibotスタジオは次のOCRエンジンの使用をサポートしています。
    • Tesseract 4.0(LSTM)
    • Windows
    • ABBYY
    • Abbyy クラウド
    • Google クラウド
    • Microsoft クラウド
    • Amazon クラウド
  2. Language(言語):選択したOCRエンジンでサポートされているすべての言語を表示します。
    既定の言語は「英語」です。
  3. Search(検索):選択したOCRエンジンのプロパティを検索できます。
  4. Options(オプション):選択したOCRエンジンに基づいてさまざまなオプションを有効にします。

ポート

OCRTextコンポーネントは、既定でコントロール入力ポート、コントロール出力ポート、データ入力ポート、データ出力ポートを持っています。

ポート 説明
Control In
(コントロール入力)
1つ以上のコンポーネントのコントロール出力ポートに接続する必要があります。
Control Out
(コントロール出力)
他のコンポーネントまたはコネクタのコントロール入力ポートに接続できます。
Data In (データ入力)
- ビットマップ
他のコンポーネントまたはコネクタのデータ入力ポートに接続できます。
Data Out (データ出力)
- 文字列
抽出されたテキスト(文字列)を返します。

プロパティ

OCRTextコンポーネントのプロパティを編集するには、プロパティ ウィンドウで、必要なプロパティを変更できます。

次のプロパティを編集できます。

プロパティ 説明
Search それぞれのプロパティを検索します。
Delay After Execution アクションが実行された後(秒単位)の待機時間を指定します。
Delay Before Execution アクションが実行されるまでの待機時間(秒単位)を指定します。
Name OCRTextコンポーネントの名前を指定します。
Image Source Image Source(画像ソース)には2つのオプションが表示されます:
Port:画像の読み取り元となる別のコンポーネントに接続できます。
FilePath:保存された画像のFilePathを指定できます。

画像からのテキストを抽出する例を見てみましょう。

テキストを抽出するには:
まず、ReadFromFile コンポーネントを使用して、次のように読み取ることができる画像を OCR テキストに提供します。

  1. ToolboxUtilitiesを展開します。
  2. Image Utilitiesを展開します。
  3. ReadFromFileコンポーネントをドラッグして、デザインサーフェイスにドロップします。
  4. FilePathをダブルクリックし、保存した画像のファイルパスを記載します。
  5. OCRTextコンポーネントで画像をテキストに変換するには:
    • ToolboxActionsを展開します。
    • OCRTextコンポーネントをデザインサーフェイスにドラッグアンドドロップします。
  6. Showコンポーネントは抽出したテキストを確認するために使用します。
  7. Showコンポーネントを追加するには:
    • Generalを展開し、Showコンポーネントをデザインサーフェイスにドラッグアンドドロップします。
  8. 以下のコネクタを接続します:
    • StartコンポーネントとReadfromFileコンポーネント間のコントロールポート。
    • ReadfromFileコンポーネントのコントロール出力ポート をOCRTextコンポーネントのコントロール入力ポート へ。
    • ReadfromFileコンポーネントのデータ出力ポート をOCRTextコンポーネントのデータ入力ポート へ。
    • OCRTextコンポーネントのデータ出力ポート をShowコンポーネントのデータ入力ポート へ。
    • Messageboxコンポーネントのコントロール出力ポートをEndコンポーネントのコントロール入力ポート へ。
  9. Runをクリックします。
  10. テキストの抽出が正常に行われると、次のようにメッセージボックスに表示されます。