【VRAV】バーチャルリアリティAV総合 110

【VRAV】バーチャルリアリティAV総合 110 (949ﾚｽ)
上下前次 1-新
通常表示 512ﾊﾞｲﾄ分割ﾚｽ栞

144: 名無しさん＠ピンキー [] 2024/11/15(金) 19:12:24.60 ID:IaJYzSB+

Depth Proは静止画だけのようだ
動画では常にDepth Anything V2が使われてる

ADIVの静止画の設定は真ん中の「Setting」アイコンから「Advanced」
動画の設定は再生時に右に現れる「Toolbox」アイコンから「Video」
と分かれてるっぽいな
わかりづらいｗ
ADIVは元々静止画専用で開発され、動画の立体化機能は後から付け足したのでこうなってるのかもしれない

Apple開発のDepth Proが適用されるのは今のところ静止画だけ
SettingsのAdvancedのDepth QualityでProを選ぶと静止画の深度推定モデルがDepth Pro
それからSettingのAdvancedのDepth Resolutionで、静止画の深度推定の解像度を選ぶが、これが静止画の生成速度に影響する
ただしProの場合、1536x1536で固定のようだ
解像度の高い画像を表示させると「人間が本当にそこにいるレベル」なのでやばい
SettingsのImageのUse Depth+を有効にするとDepth+アイコンで細かく、凹凸を調整できるが、乳首の飛び出し具合まで細かく調整できてさらにやばいｗ

動画のモデルはToolboxのVideoのVideo Modelで選べる
ここにProはないので、動画はDepth Pro未対応
ここのResultionが、動画の深度の解像度であり、パフォーマンスに影響するようだ
深度推定を行っている解像度はSettingsのAdvancedのShow Debug Generator Windowをオンにすると、PCの方に表示されるデバッグウィンドウで確認できる

深度推定を行っている解像度が高い方が凹凸が細かくなる
Depth Anything V2と、Depth Proの違いはよくわからない
後に出たDepth Proの方が「間違いが少ない」はずだけど
Vision Transformerを使って奥行きの情報を推定しているので、多分、全体の画像の意味を把握し、他のパーツとの相対的な位置関係から奥行きの情報を判断しているはず
Vision TransformerはChatGPTで使われてるTransfomerを画像に応用したものだ

http://mercury.bbspink.com/test/read.cgi/avideo/1731243577/144

上下前次 1-新書関写板覧索設栞歴

あと 805 ﾚｽあります
ｽﾚ情報赤ﾚｽ抽出画像ﾚｽ抽出歴の未読ｽﾚ AAｻﾑﾈｲﾙ

ぬこの手ぬこTOP 0.009s