RTX3060へのグラボ換装で
PremierePro・Lightroomの動作は変わるのか?(2023.01.09)
本来であれば、グラボの換装なんて話は、アイテム系としてアップするものかもしれないが、今回はあくまでクリエイティブ要素だけでRTX3060へのグラボ換装を試みたので、カメラ要素としてこのコーナーで紹介したい。
現在のメインPC
これまでグラボなんて気にしてなかった
現在、私がメインで使用しているPCは、5年程前の2018年春に購入したマウスコンピュータのDAIV。
当時は、ちょうどα7RIIIを購入した半年後で、高画素機を導入したことで、PC負荷も高まるということで、前世代のCorei7-3770KからCorei7-8700Kに乗り換えた。
購入以来、あれこれと増改築を繰り返しているのだが、主要スペックは以下の通り。
CPU:Core i7 8700K 6コア12スレッド 3.7GHz
メモリ:16GB ⇒ 48GBに増設(PC4-19200/DDR4-2400 16GB×2+8GB×2)
ストレージ:NVMe M.2 SSD 512GB + 1TB、SATA SSD×3、HDD
グラボ:NVIDIA GeForce GTX1060 3GB
マザーボード:Intel Z370チップセット
この中で、今回のテーマはグラフィックボード。
実は、このPCを購入するときも悩んだのはグラボで、Lightroomを使用するのにあまりグラボは影響しないことは認識していたので、GTX1050でも良いのかも?とは思ったのだが、ちょうどメインディスプレイを4Kモニターに変えたこともあったりして、念のためにGTX1060を選んだという感じ。
無論、今でもLightroomでセレクト作業をしたり、RAW現像をしたりするのには、特段不自由は感じていない。ただ、何かと気になり始めたのは、PremiereProで動画編集をするようになってから。私の場合、4K素材を4Kで編集・書き出しまで行うので、そこそこ負荷は大きい。編集でそこまで凝ったことはしてはいないが、エンコード時間はまだしも、編集時のプレビュー時のモッサリはなかなかの苦痛だ。
そこに、12月に入ってからのPremiereProの不調が加わった。
とりあえず、Day.2の編集終わって書き出し中。
— Ke-Kun Photo (@evo_tak_photo) December 11, 2022
ただ、5時間レースだったとはいえ、45分の動画とか、もう1時間番組級💦。
そして、さすがにCorei7 8700K×GTX1060×PremiereProでの4K動画編集はそろそろ限界なのか、ここにきて強制シャットダウンの嵐。
雰囲気的にはグラボ周りが原因な感じなのだが…
2年ぶりの鈴鹿戦で、初めての鈴鹿編の動画編集、しかも5時間のS耐レースであれこれ撮影もしたということで、大変な超大作になってしまったのだが、この編集作業がなかなか大変だった。
ちなみに、私のPCで起きたブルースクリーンは、この「VIDEO_MEMORY_MANAGEMENT_INTERNAL」ってやつ。(画像はネット上からの拾いモノ)
— Ke-Kun Photo (@evo_tak_photo) December 12, 2022
だぶん、グラボ周りだろうと、ドライバーアップデートしたりしたけど、それでも落ちるから、エンコードをCPUにしてる。 pic.twitter.com/pRPlCGv88s
何度か、この「VIDEO_MEMORY_MANAGEMENT_INTERNAL」ってやつで、ブルースクリーンで強制シャットダウンをすることがあった。
結果的には、グラボ側というか、PremierePro側のバグっぽかったが、GTX1060のVRAM 3GBというのも、動画編集をする上では当然苦しいところがある。なので、そろそろ次を考えないとな…と思い出したのである。
新PCに行くか、とりあえずグラボを変えるか
そんなこともあって、12月中盤以降、「新しいPC欲しいな~」「新しいグラボ欲しいな~」と心が揺れていた。
実際、動画編集時のタスクマネージャーを見ていても、GPUの使用率よりもCPUの使用率の方が高いので、CPU側がボトルネックになっていることは明白だった。そう思えば、新しいPCを新調した方が現実的だと思われる。
新PC的にはちょっとタイミングが悪い
ただ、グラボ自体はだいぶん安くなってきたとはいえ、円安と原材料コストや輸送コストの上昇などで、何かと高値が続いていて、決して今がいいタイミングとはいえない。第13世代のIntelCPUも性能はいいんだけど、爆熱仕様。次の第14世代が製造プロセス小さくなるし、おそらく省電力かつ高性能だろうと。そう考えると、次の第14世代が1つの狙い目だと思うんですよね。そう思うと、もう少し待った方がいいなかと。
グラボも見方によってはタイミングが悪いが…
グラボに関しても、いいという見方と悪いという見方の両方が出来る。
いい方では、マイニング需要からの価格高騰で高値品薄が続いていたRTX3000番台が、値段も落ち着き、まあ買える価格帯にまで落ち着いてきた。しかも、この年末年始辺りから、3000番台を処分セールで売ってしまうケースが見えてきたので、もし3000番台に手を出すなら今だろうと思ったわけです。
一方で、新しいRTX4000番台が登場し、今年中にはRTX4060も登場するのでは?と言われている。4000番台は、NVENCは2基搭載される上に、YouTubeなどに利用されているAV1コーデックのエンコードにも対応してくる。そう思うと、RTX4060の登場まで待った方がいいのでは?とも考えてしまう。ただ、値上がり必至だからな…。
結果、RTX3060の購入を決断!
だいぶん、いろいろと悩んだ結果、今回はとりあえずRTX3060だけを購入してみることにした。万が一、自作PCを作ることになったとしても、このRTX3060を流用すればいいし。
私の仕様用途で、ハイスペックグラボは要らない
まずもって、いろいろと調べている中で、私のように、LightroomやPremiereProメインでのグラボ使用で、ゲームをほとんどやらないような人にとって、それほどハイスペックなグラボは要らない。
このことは、いろいろなサイトを見ても何となく分かっていた。
例えば、こちらのサイトの情報だと、i5 12400とRTX3050の組み合わせでα7SIIIの4K動画ファイルをPremiereProで編集している感じですが、これだとCPUはもうちょっと強くてもいいけど、GPUは意外と3050でもイケちゃったりしています。
あと、クリエイティブ用途だとVRAM 12GBが大きいという評価もよく耳にしていた。そういったことを総合的に考えた時に、まあこのRTX3060 12GBというところが妥当だろうと。そう思いたったわけです。
RTX3060のスペックを眺めてみる
GTX1060 3GB | RTX3060 12GB | ||
コア | アーキテクチャ | Pascal GP106 |
Ampere GA104 |
コアクロック | 1,506MHz [1,709MHz] |
1,320MHz [1,777MHz] |
|
CUDAコア | 1,152 | 3,584 | |
メモリ | タイプ | GDDR5 | GDDR6 |
バス幅 | 192bit | 192bit | |
帯域 | 192GB/s | 360GB/s | |
NVENC | Generation | 4th Gen | 7th Gen |
容量 | 3GB | 12GB | |
消費電力 | 120W | 170W | |
ちなみに、現在のGTX1060とRTX3060のスペックを比較するとこんな感じ。CUDAコア数は約3倍に、メモリ帯域も2倍に、VRAMは4倍にっていうのが、やはり進化を感じますね。
RTX3060の開封と設置
✨新春セール情報✨
— パソコン工房鳥取安長店@水曜&木曜定休日 (@tottoriyasunaga) January 2, 2023
グラフィックボードのRTX3080まだありますー‼️
お買い得なのでお早めに🙇♂️#ゲーミングPC #パソコン工房初売り2023#セール #セール品 #特価 #特価品#パソコン工房 #パソコン工房鳥取安長店 pic.twitter.com/fnzvaYsOjq
ということで、RTX3060を購入した訳ですが、ちょうど年明け初売りでパソコン工房さんで、RTX3060が特売になっていたので、正月早々に買いに行きました。
GIGABYTEさんのGV-N36060EAGLE OC-12GD R2.0。何となく、1連ファンだとうるさそうなイメージがあるので、2連ファンにしたいなとは思ってました。実は年末まで、ASUSのRTX3060がもう少し安くて買おうか買わまいか悩み、結果、年内に買う決断までに至らなかったのがホントのところ。
基本、私の場合、BTOでこれまで購入してきたので、あんまりグラボ単体を買うことが無くて、16年前ぐらいにトリプルディスプレイ化するために買った時以来かな。
取り出してみるとこんな感じ。シンプル・ザ・ベストって感じで悪くないです。
バックパネルはこんな感じ。たぶん、プラスチック製かな?。
端子類はDisplya Portが2系統とHDMIが2系統。DP×3+HDMIが多い中、HDMI×2ってのは珍しいかも。
DAIVを開けて、GTX1060を取り出します。
GTX1060とRTX3060を比べるとこんな感じ。実は、こう並べて見てから初めて、「思ったよりもデカいな…。で、入るよね?」って心配になったのはここだけの話。
ちょっと心配になりながらでしたが、無事RTX3060が収まりました。SATAの端子がギリギリでした。
心配していた電源ケーブル
実は、今回ちょっと心配していたのが電源でした。これまでのGTX1060の補助電源は6ピン1本。それに対して、今回のRTX3060の補助原電は8ピン1本なんです。
「え~、電源交換までしないといけないのか…」と悩んでいたのですが、あれこれ調べると、変換ケーブルがあることを発見!。
これ、6ピン×2本を8ピン1本に変換するケーブルです。6ピンが75Wで8ピンが150W。ってことは、6ピン×2を8ピンに変換しても大丈夫……なはず。
事前にネットでも見つけていましたが、グラボを購入しに行ったときに、パソコン工房の店頭にもあったので、一緒に買ってきました。
ということで、無事電源も確保して電源投入!。ほんのりと青く光ります。個人的には、光系とかどーでもいい人なので、付かない方がよかったんだけどな…。まあ、これぐらいならどーでもいいです。
Lightroom CCで試すと意外な結果に…
搭載が完了したので、PremiereProが本番として、まずはLightroomから試してみます。
想像以上の効果だった「書き出しにGPUを使用」
先程も述べた通り、Lightroomの場合、そんなにGPUに影響を受けることはないのですが、ちょっと前(2022/6配布のVer.11.4)から「書き出しにGPUを使用」というのが選べるようになっています。
ただ、ある程度高性能なGPUじゃないと効果が無いとかいう話を聞いたりしていたので、どんなもんか試してみたかったのです。で、試した結果がコチラ。
これ、結構衝撃的です!。
だって、GPU支援なしとRTX3060の書き出し時使用で、RAW現像が約半分の時間に短縮されるってことですから。この性能差をCPUとかで出そうと思ったら、相当上位CPUにしないとキツイと思いますよ。コレはスゴイ!。
たまにGPU支援なしの方が速い時がある!?
今回試していて、ちょっと不思議な場面がありました。
そう、GPU支援なしとGTX1060を比較すると、GPU支援なしの方が速くなるという逆転現象がたまに起きてしまっていたんです。私も、はじめは「おかしいな?」と思ったのですが、タスクマネージャーの動きを見ていたら納得しました。
RTX3060を使った「書き出しにGPUを使用」
これが、爆速だったRTX3060のGPUを利用した時のタスクマネージャーです。この「書き出しにGPUを使用」なのですが、実はCUDAコアとかはほとんど使っていません。実は、RAW現像をスタートしてから使っているのはVRAM(+5GB)みたいなんですよね。むしろ、CPUの方がボトルネック気味になっているように見えます。
GTX1060を使った「書き出しにGPUを使用」
一方で、GTX1060でも現像をスタートしてから、VRAMの使用が増えていますが、元々3GBと少ないVRAMなので、+1.5GBぐらいしか使えない状況になっています。事実、CPU使用率は半分にも満たない感じになっているので、完全にVRAMの部分がボトルネックになっているように見えます。
「書き出しにGPUを使用」をオフにしたRAW現像
むしろ、「書き出しにGPUを使用」を選択すると、メインメモリの方が使われるのか、CPUが100%でフル回転で動き始めます。どうやらこの辺りの差が、書き出し時間に影響しているように思われます。
そう考えると、Lightroomでの「書き出しにGPUを使用」を生かすには、VRAM容量が少なくとも6GB、出来れば8GB以上のものを選んだ方がいいように思います。逆に、低スペックなグラボの場合は、逆転してしまうケースも私の場合以外でもあるようです。なので、一度タスクマネージャーを見ながら時感も計測しつつ、自分のPCがどんなものか計測することが地味に大切だと痛感しました。
つい最近まで、CPU性能だけにとらわれがちだったLightroomの書き出し時間ですが、私のかつての経験でも、メモリ速度なんかも影響するようなので、ある意味この仕様には納得します。
GPU支援が効くファイルと効かないファイルがある!?
もう1つ、この検証でちょっと気になったことがあります。
実は、先程のグラフは一部省いたデータがあります。それがこれ
先程の数値に、α7RIIIのデータの場合が加わっているのですが、これ、α7RIIIの書き出しが、GPU支援無しもGTX1060もRTX3060もほぼ横一線で誤差の範囲です。当初、計測ミスかな?とか思って何度か試したのですが、いずれも似たような数値になってしまいます。
ただ、何となく先程の検証で、察しました。GPU支援ありと無しが同じということは、GPU支援が機能してなくて、VRAMが働いてないのでは?と。
α7RIIIのデータでRTX3060を使った「書き出しにGPUを使用」
想像通りですね。ちゃんと、「書き出しにGPUを使用」を選んでいるのに、全くVRAMが使われず、オフの状態と同じ現像になってしまっています。これは、GTX1060の時も同じ。
一方、同じα7RIIIのデータでも、ある時期を境に出来るようになったりするし、α7IIのデータとかでも同じことが起きるみたいで、この原因が特定が結構難航しました。
どうやら処理バージョンが大事らしい
あれこれ探していたら、このキャリブレーション項目の中にあるバージョンが影響していることが判明。
このバージョン、「プロセスバージョン」というらしいですが、Adobeのページによると、Camera Rawで使用するテクノロジーとのことなので、これを最新にしないと効果が出ないということなのでしょう。
っていうか、後から気づいたけど、『書き出しにGPUを使用』の項目の上に、『画像処理(処理バージョン5以降)にGPUを使用』ってちゃんと書いてあったわ。
ちなみに、Adobe公式を眺めてみたら、この処理バージョンが5になったのは2018年11月のアップデートとのこと。今回、私が検証に使ったα7RIIIのカタログは、2017年12月に撮影したデータで、現在のメインPCを購入した2018年春にLightroom速度検証用に別途用意していたカタログだったので、確かにちょうどこのアップデートの前のものでした。
なので、4年以上前にLightroomに読み込んだRAWデータは、バージョン4のままになっている可能性が高いので、もし古いRAWデータを大量に現像するという場合は、このあたりも確認した方がいいでしょう。
なので、実際に、バージョンを5にしたら、VRAMが働くようになって現像時間が3分ちょっとに短縮しました(それでも、α7RIVよりも遅かったのは、よく分かりませんが…。被写体もシチュエーションも違う画像だったので、その点の差が出たのかな?。現像項目を適用し直したら逆転するかな?)。
今回の検証を動画にまとめてみたので、もし良かったら参考にして頂ければと思います。
(動画中のタスクマネージャーの映像とこのページに掲載している画像は異なっているので、その点は悪しからず)
PremiereProでの効果
続いて、ある意味本命であるPremiereProでの効果の検証をしていきます。
書き出し性能
まずは性能差が分かりやすい書き出し性能から見ていきます。
YouTubeにアップしたS耐鈴鹿戦のシーケンスから、GoPro HERO11のTimeWarp機能を使って撮影した移動シーン1分間部分だけを書き出した時間は下のグラフ。
元データは、GoPro 11のH.265 4K 30pの映像。エンコード先は、H.264 4K 30p
私の中では、速くなっても数%程度だろうと思っていましたが、思っていたよりもエンコード性能は良さそうです。もちろん、シーンなどによっても異なるでしょうから一概にはいえませんが、まさかこんなに差が付くとは…。
そして、今回のテストをしてみて気づいてよく分ったのは、
CUDAコア
Video Encode
ってこと。もちろん、よく分かっている人にとっては当たり前なんでしょうけど、この辺りの違いがキチンと理解出来た気がします。
【レンダラーGPU × ソフトウェアエンコード】
これが、レンダラーをGPU高速処理にして、ソフトウエアエンコードをしたときの状態。CUDAコアはいくらか働いていますが、CPUが100%で張り付いており、完全にCPUがボトルネックになっています。
【レンダラーGPU × GTX1060ハードウェアエンコード】
続いて、レンダラーはGPUのままで、GTX1060でハードウェアエンコードを行ったときの状況。先程とは比べものにならないぐらい、CUDAコアが100%で張り付いているけど、Video EncodeとCPUはそれほど働いてない。つまり、CUDAコアがボトルネックということになります。
【レンダラーGPU × RTX3060ハードウェアエンコード】
最後に、RTX3060でハードウェアエンコードを行った場合、CUDAコアもVideo EncodeもCPUも結構バリバリに働いています。ただ、この感じだと、ボトルネックはCPUなのかもしれませんね。
逆に言えば、自分の書き出し状況をタスクマネージャーで見ながら、何処がボトルネックになっているのかを見て投資をするというのが正しいのでしょうね。私の場合だと、これ以上ハイスペックのグラボにしたところで、さらにエンコードが速くなるというのは考えにくく、むしろCPU・マザーボードの換装の方を考えた方が賢明ですもんね。
プレビュー性能はほとんど分からない
続いて、性能差を判断しにくいが、体感的にはストレスになることが大きいプレビュー性能を見ていきたかったのですが、これについては、もうほとんど差が分からないレベルでした。今回、改めてGTX1060でのプレビューも見ましたが、普通に動いちゃってたし、タスクマネージャーを見ても、VRAMはMAXだったものの、CUDAコアもVideo DecodeもCPUも余裕がありました。なので、もちろんRTX3060も普通でした。
これが、4Kを4本並べて再生して…とかになるともうちょっと変わるのかもしれないけど、もし気になる点が出てくれば追記したいと思います。
TMPGEnc VMW7でのエンコード
せっかくなので、私が動画編集というよりも、動画ファイルの変換に利用しているTMPGEnc Video Mastering Works 7を使ったエンコードも試してみました。
TMPGEncも長年愛用しているソフトではありますが、今まであまりNVENCとか意識してこなかったですね。
Normalは単純に、1分のH.265の動画(GoPro HERO11)をH.264に変換したもの。NVENCを使うことで、実時間を少し切るぐらいに短縮出来ますが、GTX1060とRTX3060の差はありません。
また、先の動画を200%再生にして変換をしたものが200%というものになりますが、実時間も30秒になるので、こちらは実時間よりもわずかに長くなる感じ。それにしても、こちらもGTX1060とRTX3060の差は無い感じでした。
ただ、不思議なのは、GTX1060だとCUDAコアが50-60%程度働いていたのに、RTX3060だと5%程度しか動いてませんでした。CUDAコア数が3倍で性能差もあるにしても、この開きは大きい気がするんですよね…。何か設定ミスしましたかね?