OpenCV を使用してビデオをキャプチャして保存する
コンピューター ビジョンは、コンピューター サイエンス、特に人工知能の分野であり、コンピューター システムがデジタル画像、ビデオ、およびその他の視覚的ソースから詳細を理解し、抽出できるようにします。
コンピューター ビジョンを使用すると、オブジェクト検出、画像分類、セグメンテーション、エッジ検出、顔認識、パターン検出、特徴マッチングなど、さまざまな複雑なタスクを実行できます。
現在、Python を含むさまざまなプログラミング言語がコンピューター ビジョンをサポートしています。 Python は、汎用性の高い動的型付けの汎用プログラミング言語です。
コンピューター ビジョンの実行に役立つライブラリ、OpenCV または Open Computer Vision があります。
OpenCV は、Intel が開発したリアルタイム コンピュータ ビジョン ライブラリです。 これは、C および C++ プログラミング言語で書かれたクロスプラットフォーム ライブラリです。
このライブラリを使用すると、ビデオのキャプチャ、ビデオ フレームの処理、色の操作、画像やビデオの変換など、さまざまなタスクを実行できます。
この記事では、Web カメラのビデオを記録し、OpenCV を使用して保存する方法を学習します。
OpenCV を使用してカメラ ビデオを保存する
次の Python コードを参照してください。
import cv2
capture = cv2.VideoCapture(0)
fourcc = cv2.VideoWriter_fourcc(*"XVID")
out = cv2.VideoWriter("output.avi", fourcc, 20.0, (640, 480))
while capture.isOpened():
ret, frame = capture.read()
if ret == True:
out.write(frame)
cv2.imshow("frame", frame)
if cv2.waitKey(1) & 0xFF == ord("q"):
break
else:
break
capture.release()
out.release()
cv2.destroyAllWindows()
上記の Python コードは、システムの Web カメラが見たものをすべて記録し、ユーザーがキーボードの Q キーを押すと、記録を停止し、カメラ ウィンドウを閉じて、ビデオ ファイルを名前で保存します。 作業ディレクトリの output.avi
の
まず、cv2.VideoCapture()
メソッドを使用して、システムのカメラのビデオ キャプチャ オブジェクトを取得します。 次に、cv2.VideoWriter_fourcc()
メソッドを使用してビデオ コーデックを指定します。
次に、カメラ ウィンドウのサイズと出力プロパティを宣言します。
次に、カメラが見たものをキャプチャし、Q キーが押されるまで保存し、ループが終了する for
ループを宣言します。 最後に、ビデオが保存され、カメラ ウィンドウが破棄され、Web カメラが解放されます。