【VRAV】バーチャルリアリティAV総合 110 (949レス)
【VRAV】バーチャルリアリティAV総合 110 http://mercury.bbspink.com/test/read.cgi/avideo/1731243577/
上
下
前
次
1-
新
通常表示
512バイト分割
レス栞
144: 名無しさん@ピンキー [] 2024/11/15(金) 19:12:24.60 ID:IaJYzSB+ Depth Proは静止画だけのようだ 動画では常にDepth Anything V2が使われてる ADIVの静止画の設定は真ん中の「Setting」アイコンから「Advanced」 動画の設定は再生時に右に現れる「Toolbox」アイコンから「Video」 と分かれてるっぽいな わかりづらいw ADIVは元々静止画専用で開発され、動画の立体化機能は後から付け足したのでこうなってるのかもしれない Apple開発のDepth Proが適用されるのは今のところ静止画だけ SettingsのAdvancedのDepth QualityでProを選ぶと静止画の深度推定モデルがDepth Pro それからSettingのAdvancedのDepth Resolutionで、静止画の深度推定の解像度を選ぶが、これが静止画の生成速度に影響する ただしProの場合、1536x1536で固定のようだ 解像度の高い画像を表示させると「人間が本当にそこにいるレベル」なのでやばい SettingsのImageのUse Depth+を有効にするとDepth+アイコンで細かく、凹凸を調整できるが、乳首の飛び出し具合まで細かく調整できてさらにやばいw 動画のモデルはToolboxのVideoのVideo Modelで選べる ここにProはないので、動画はDepth Pro未対応 ここのResultionが、動画の深度の解像度であり、パフォーマンスに影響するようだ 深度推定を行っている解像度はSettingsのAdvancedのShow Debug Generator Windowをオンにすると、PCの方に表示されるデバッグウィンドウで確認できる 深度推定を行っている解像度が高い方が凹凸が細かくなる Depth Anything V2と、Depth Proの違いはよくわからない 後に出たDepth Proの方が「間違いが少ない」はずだけど Vision Transformerを使って奥行きの情報を推定しているので、多分、全体の画像の意味を把握し、他のパーツとの相対的な位置関係から奥行きの情報を判断しているはず Vision TransformerはChatGPTで使われてるTransfomerを画像に応用したものだ http://mercury.bbspink.com/test/read.cgi/avideo/1731243577/144
上
下
前
次
1-
新
書
関
写
板
覧
索
設
栞
歴
あと 805 レスあります
スレ情報
赤レス抽出
画像レス抽出
歴の未読スレ
AAサムネイル
Google検索
Wikipedia
ぬこの手
ぬこTOP
0.009s