PDG HQueueで、ROP系ノードを使い、All Frames in One Batchで処理を行うと途中で止まる

   363   3   0
User Avatar
Member
6 posts
Joined: July 2018
Offline
ほぼ表題通りです。
厳密には、10個目のワークアイテムを処理した際に止まります。

All Frames in One Batchをやめて、Frames per Batchにするといけます。ギリギリの9まで上げても問題ないです。10にすると同様に止まります。

また、All Frames in One Batchの際に、Automaticaly Set Missing Framesをオンにすると、Cook Frames as Single Work Itemをオンにすると、ワークアイテムが1つにまとめられてしまいますが、動きます。

ちなみに止まり方ですが、エラーが出るわけではなく10個目のワークアイテムを永遠に処理し続けてしまい、実質止まります。(1日待っても動きませんでした)

All Frames in One Batchで行いたい理由は、シミュレーションのキャッシュを行いたいからです。

何かご存知ではないでしょうか?
Edited by kurosaba - May 16, 2024 02:46:29
User Avatar
Staff
22 posts
Joined: Feb. 2022
Offline
実際に動いている状況を確認してみないことには断定はできませんが、文章の限りでは、複数のシミュレーションを同時に処理しようとしてメモリ不足などのエラーに陥っているように思えます。
もし一台のマシンで Local Scheduler をお使いの場合は、シミュレーション自体をまったく別の非常に軽量なものに差し替えるか、 Job Params -> Scheduling -> Singleにチェックを入れて、ひとつずつ順番にシミュレーションが行われるようにしてもう一度お試しいただくと良いかもしれません。

それでも解決しない場合は、可能な限り問題と関係ない部分を削除した上で問題が再現できる最小限の hip ファイルと、その手順、お使いのマシン情報など詳細を併記、添付いただけますと解決が早まる可能性があります。
Edited by Satsuki_Sensei - May 17, 2024 03:14:13
User Avatar
Member
6 posts
Joined: July 2018
Offline
スケジューラはHQueunスケジューラです。

説明が少々複雑ですが、クライアントマシンを直接操作し、ローカルスケジューラで処理させる分には固まりません。しかし、作業者のマシンからHQueueスケジューラにてジョブを提出し、クライアントマシンに処理させると、前投稿にあるように処理が固まります。

自分が知りたい点としましては、「何故ローカルスケジューラなら問題ないのに、HQueueスケジューラだとダメなのか」です。

仮にHQueueスケジューラ時にメモリフローを起こしてるのであれば、ローカルスケジューラでもメモリフローしてるはずのような…?


環境漏れてました。マシンのコアは32コア64スレッドで、メモリは128GBです。Houdiniのバージョンは全て統一で20.0.590です。

仮に情報不足で推察すら出来そうになければ、いずれ何かの形でサンプルを提供させていただくと思います。その際は持ち掛けていて恐縮ですが、お時間下さい。
User Avatar
Staff
22 posts
Joined: Feb. 2022
Offline
お手数ですが、Houdini や HQueue のバグという可能性もございますので、最新のプロダクションビルド(20.0.688)やデイリービルドもお試しいただくと良いかもしれません。
もし解決しない場合には、ネットワークの問題の場合はこちらの環境で再現できず解決できない可能性もありますが、サンプルファイルをご用意いただきたく存じます。
  • Quick Links