データセットの生成

回帰問題では、ラベル付きサンプルのコレクションに対してMLをトレーニングします。そこでは、ラベル付きサンプルのターゲットは、連続的な入力に依存します。これは、出力が連続的ではなく離散的である分類問題とは異なります。

Houdiniでプロシージャルネットワークを近似化する方法を知りたいとしましょう。その場合には、入力は、そのプロシージャルネットワークに送信するジオメトリとなります。それに呼応するターゲットは、その入力に対してそのプロシージャルネットワークが最後に出力したものになります。各入力コンポーネント-ターゲットコンポーネントのペアは、ML Exampleを使用して、ラベル付きサンプルとしてまとめられます。各ラベル付きサンプルは、2個以上のパックプリミティブを含んだパックプリミティブです。ラベル付きサンプルを含んだジオメトリをマージすることで、ラベル付きサンプルのコレクション全体を表現した単一ジオメトリを形成することができます。このデータセットジオメトリをML Example Extract SOPに使用することで、各ラベル付きサンプルを検査することができます。

Example Decompose SOPは、ラベル付きサンプルから別々に入力コンポーネントとターゲットコンポーネントを取得することができます。

トレーニングスクリプトに渡すことができるデータセットを作成する前に、各ラベル付きサンプルの入力コンポーネントとターゲットコンポーネントの両方を、データに暗号化されたPointアトリビュートとボリュームを持ったジオメトリに変換する必要があります。これを行なうには、SOPで別々のForループを使用するか、または、TOPを使用します。 入力コンポーネントとターゲットコンポーネントは、Pointアトリビュートとボリュームを持つジオメトリを使用して完全に表現することができ、正確なデータが保持されますが、そのデータを前処理してそのデータの次元を減らすこともできます。その例としては、Principal Component Analysis SOPの使用がそれです。

入力とターゲットがPointアトリビュート/ボリュームにデータを保持したジオメトリの形式になったら、ML Example Outputを使用してそのデータセットを書き出すことができます。そうすることで、ML Regression Train TOPにそのデータセットを使用することができます。

データセットの生成

機械学習

一般的なサポート ¶

サンプルベースのML ¶

リファレンス ¶