On this page | |
Since | 20.5 |
合成データ(Synthetic Data)パイプラインは、COCO(Common Objects in Context)フォーマットに準拠したデータを生成します。 このフォーマットは、コンピュータビジョンモデルトレーニングで広く使用されている規格です。 このフォーマットには、いくつかのタイプのGround Truthアノテーションが含まれています: 境界ボックス(bbox)、セグメンテーション(RLEとポリゴン)、キーポイント。 また、その拡張性によって、合成データによって得られる追加シグナルを使用してベーススキーマを拡張することが可能です。
このPDGノードは、合成データパイプラインのベーステンプレートとして機能します。
これは、コンテンツ生成からアノテーションエクスポートまでのデータセットを管理します。
そして、パイプラインの様々なステージでのコンテンツ生成のシードとして使用可能なグローバルPDGアトリビュートをセットアップします。
これは、Labs ML CV ROP Annotation Output SOPや
Labs ML CV Synthetics Karma ROPなどの他のSyntheticsノードと連携するように設計されています。
Tip
初回でこのノードを新しいディレクトリ内で実行すると、Python仮想環境のセットアップが必要になるので、クックに時間がかかります。
そのPython仮想環境は、デフォルトでは$HIP/ml/labs/
下に保存されます。
次回、既存の/ml/labs/
フォルダとその内容を新しい$HIP
ディレクトリにコピーすることで、この処理を高速化することができます。
Note
デフォルトのアトリビュートは以下のとおりです:
@variant
: 'Variant Count'パラメータによって生成されたバリアントの数。
@frame_index
: 'Frame Range'パラメータで指定されたフレーム番号。これは、バリアント単位で繰り返されます。
@seed
: フレーム単位で生成されたランダムな浮動小数点値。これは、フレーム/バリアント単位で固有です。
@v_seed
: バリアント単位で生成されたランダムな浮動小数点値ですが、フレーム単位では同じ値です。
@frame_name
: ファイル出力の命名に使用される文字列。
@ds_dir
: データセットレンダーディレクトリのパス。
@ds_major
: データセットのメジャーバージョン番号。
@ds_minor
: データセットのマイナーバージョン番号。
@res
: データセット内の画像の解像度。
オリジナルのML Computer Visionツールは、Endava PLC社のSynthetic Dataチームによって開発されました。
パラメータ ¶
Cook Controls ¶
Generate Static Work Items
TOPネットワーク内のすべてのノード内に静的ワークアイテムを生成します。 それらのどのワークアイテムもクックされず、動的ノードは何もしません。
Dirty All
TOPネットワーク内のすべてのノード内のすべてのワークアイテムをDirtyにし、そのネットワーク内のすべてのノードを再クックする必要があるとマークします。
Delete All File Outputs From Disk
既にクック済みのすべてのディスク上のファイルを削除してから、TOPネットワーク内のすべてのノード内のすべてのワークアイテムをDirtyにします。
Custom Python Bin
カスタムPython3.11実行ファイルのパス(MacOSまたはLinuxの場合、このフィールドを空っぽのままにしてください)。
Windowsユーザーの場合、現在のHoudiniバージョンとのOpenEXR互換性の問題により、この設定が一時的に必要となります。
お好みのPython3.11実行ファイルをダウンロードしてください。
例えば、公式のPython Release Python 3.11.0にアクセスして、Filesセクションで、Windowsインストーラ(64ビット)をダウンロードすることができます。
インストール時に手動でそのインストール先を変更しない限り、デフォルトの実行ファイルパスはC:\Users\<username>\AppData\Local\Programs\Python\Python311\python.exe
となります。
Dataset Controls ¶
Render Directory
データセットがレンダリングされる場所。
Delivery Directory
処理されたデータセットの保存先を指定します。 このバージョンには、トレーニングに必須のファイルのみが含まれます。
Debug Dataset and Skip Delivery
データセットのメジャーバージョンとマイナーバージョンを指定します。
メジャーバージョン: 通常、データセットのメジャー変更に使用され、フレームシード単位でデータセットシードが変更されシャッフルされます。
マイナーバージョン: 同じマスターバリアントシードを維持する増分変更に使用されます。
Annotations ROP
SOPコンテキスト内のML CV ROP Annotation Outputノードのパス。
Synth Render ROP
RGBAパス用に設定されたML CV Synthetics Karma ROP LOPのパス。
Synth GT Render ROP
GTパス用に設定されたML CV Synthetics Karma ROP LOPのパス。
FiftyOne ¶
View Data Set on Complete
レンダリングが完了したら、Fifty Oneのインスタンスで現在のデータセットを開きます。
View Current Dataset
Fifty Oneのインスタンスの“Dataset Version”パラメータで定義されたデータセットバージョンを開きます。
View Other Dataset
ファイルブラウザを開き、閲覧したい別のCOCOデータセットのルートディレクトリを選択します。 選択すると、そのデータセットがFifty Oneインスタンスで開きます。
Dive Targets ¶
Custom Per Variant
バリアント単位でバリエーションを加えるTOPノードを追加するための内部サブネット。例:バリアント毎に光の強度を変更する。
Custom Per Frame
フレーム単位でバリエーションを加えるTOPノードを追加するための内部サブネット。
Image Compositor
データセット内の画像間のバリエーションを増やすために、画像のルックをさらに制御するための内部COPネットワーク。
Dataset Settings ¶
Skip JSON
JSON出力をスキップします。 これは、レンダリングのテストとデバッグに役立ちます。
Dataset Version Major
データセットのバージョン。
例: Dataset Version Major が3
、 Dataset Version Minor が2
の場合、データセットバージョンはds3.2
になります。
Dataset Version Minor
データセットのサブバージョン。
例: Dataset Version Major が3
、 Dataset Version Minor が2
の場合、データセットバージョンはds3.2
になります。
Variant ¶
Variant Count
データセットに対して生成されるシーンバリアントの総数。
各バリアントは、パラメータの制御に利用可能な@variant
および@v_seed
PDGアトリビュートに関連付けられます。
Render Variant Range
バリアント範囲の使用を有効にします。
Variant Range
レンダリングするバリアントの範囲を指定します。 これは、レンダリングを複数のコンピュータに分散させる場合に役立ちます。
Info ¶
Description
データセットの目的、内容、主な特徴やハイライトなど、データセットの概要を含めるためのオプション入力。
これは、coco.json
ファイルの“info”配列に書き出されます。
Contributor
データセットの作成に関わった個人または組織の名前、役割、所属、連絡先情報を含めるためのオプション入力。
これは、coco.json
ファイルの“info”配列に書き出されます。
Notes
データセットの変更ログ情報を含めるためのオプション入力。
これは、coco.json
ファイルの“info”配列に書き出されます。
Render Settings ¶
Skip Render
有効にすると、Karmaレンダリングがスキップされ、データセットを再レンダリングせずにML CV ROP Annotation Outputノードを再クックできるようになります。
Start/End/Inc
各バリアントでレンダリングされるシーケンスの開始フレームと終了フレーム。 時間依存でないデータセットの場合は、開始フレームと終了フレームの両方の値を1に維持します。
Render Partial Sequence
指定した割合の分だけ大規模なデータセットをレンダリングできるようにします。 これは、サンプルのバリアント分布をプレビューし、目的の分布が達成されているかどうかを確認するのに役立ちます。
Percentage to Render
指定した割合の分だけ大規模なデータセットをレンダリングできるようにします。 これは、サンプルのバリアント分布をプレビューし、目的の分布が達成されているかどうかを確認するのに役立ちます。
Note
値の範囲は0から100%です。 これは、正確なパーセンテージではなく、100フレーム分のデータセットの1%が0または2フレームになる可能性があります。
Resolution
データセットの画像の解像度。
Visualize ¶
Visualize Distributions
matplotlib
を使用してsynthアトリビュートをプロットし、新しいウィンドウでそのアトリビュートを視覚化して、データセットの分布が適切であるかどうかを確認することができます。
Filter by Category
OCO JSONからカテゴリIDでフィルタリングします。
Category Name
整数カテゴリIDに関連付けられるカテゴリの文字列名。
Synth Attributes
synthアトリビュートの数。
Synth Attributes ¶
Synth Attribute
COCO JSONにエクスポートされるsynthアトリビュートの名前。
Validation Settings ¶
Skip Validation
データセットの検証をスキップします。
Validate Keypoints
キーポイントの検証を有効にして、すべてのキーポイントがデータセット内に正しく存在するかどうかを確認することができます。
Categories
カテゴリの数。
Annotation Property ¶
Annotation
検証するCOCOアノテーション名。
Image Compositing ¶
Use Shadow Matte
Synthetics Karma ROP
でセットアップされたShadow Matteの使用を有効にし、オブジェクトがバックプレートに接地するように合成されたシャドウを生成します。
Composite Background
有効にすると、それぞれの前景画像が、指定された背景ディレクトリからのランダムな背景画像に合成されるようになります。
Background Images
有効にすると、ファイルパターンから、ランダムに合成される背景のフィルターが作成されます。
Post Comp ¶
Enable Clipping
Clippingコントロールタブを有効にします。
Enable Grain
Grainコントロールタブを有効にします。
Fill Alpha
出力フレームに透明ピクセルが含まれないようにする処理を有効にします。
Grade ¶
Brightness Min/Max
画像毎にランダムに適用される明度係数の許容範囲を定義します。
Brightness
レイヤの明るさや暗さを制御するスケール係数。 値が高いほど明るさが増し、値が低いほど明るさが減ります。デフォルトは、 Brightness Min/Max で制御されるエクスプレッションになっています。
Levels ¶
Input Levels
ブラックポイントとホワイトポイントを調整してコントラストを上げます。
Gamma
中間階調のバランスを調整します。
Output Levels
Input Levels と Gammma の結果を再マップしてコントラストを下げます。
Blur ¶
Filter
BoxブラーとGaussianブラーのどちらかを選択します。
Read Pixels outside Image
フレームのエッジの挙動を定義します。
Units
ブラーの直径を表す単位を定義します。
Blur Min/Max
画像毎にランダム化されるブラー量の許容範囲を定義します。
Size
ブラーの直径を定義します。 デフォルトは、 Blur Min/Max で制御されるエクスプレッションになっています。
Scale Size
どちらかの軸でブラーを不均一にスケールします。
Clipping ¶
Mask
修正された画像とクリップされていない画像をブレンドします。
Lower Limit
レンダリング内のブラックポイントをクリップします。
Upper Limit
レンダリング内のホワイトポイントをクリップします。
Clamped Values
クランプされた値の処理方法を指定します。
Grain ¶
Grain Min/Max
画像毎にランダム化される粒の振幅の許容範囲を指定します。
Grain Amplitude
粒の強度を指定します。 デフォルトは、 Grain Min/Max で制御されるエクスプレッションになっています。
Element Size
粒の基本要素のサイズ(画像座標)。
Contrast
0から1の範囲を超えずに、ノイズをより極端に見せるために使用します。
Seed
粒パターンをランダム化します。
Advanced ¶
Base Frame Format
データ生成に使用されるベースファイル名。 デフォルトでは、フレーム番号とバリアント番号から派生します。 これを変更すると、PDGグラフの自動化部分で問題が発生する可能性があります。
Dataset Seed
データセット内のバリエーションを制御するシード。 これは、データセットのメジャーバージョンによって駆動されます。
Operating System
現在のオペレーティング システム。
Virtaul Environment ¶
Environment Path
このノードの内部トレーニングスクリプトが実行されるPython仮想環境のパス。
Examples ¶
Tip
Houdiniのヘルプブラウザでこのページを開いている場合、次のサンプルファイルのURLを通常のブラウザにコピーして、ダウンロードを進めてください。