PyTorchによるSSD Mobilenetでの転移学習(Jetson Nano)
NVIDIAのJetson Nano 2GB 開発者キットで転移学習をやってみた時の備忘録。PyTorchとOpenImages Dataset の画像を使ってSSD-Mobilenet に新たにリンゴ、オレンジ、バナナ、イチゴ、ブドウ、洋梨、パイナップル、スイカの画像を学習させた。
NVIDIAのJetson Nano 2GB 開発者キットで転移学習をやってみた時の備忘録。PyTorchとOpenImages Dataset の画像を使ってSSD-Mobilenet に新たにリンゴ、オレンジ、バナナ、イチゴ、ブドウ、洋梨、パイナップル、スイカの画像を学習させた。
NVIDIAのJetson Nano 2G 開発者キットでセマンティックセグメンテーションでの物体の検知をやってみた。物体の検知はバウンディングボックスという四角い枠で囲むやり方とセマンティックセグメンテーションといってピクセル単位で物体の輪郭を識別する技術がある。
NVIDIAのJetson Nano 2GB 開発者キットを購入したのでDeep LearningによるImageNetの画像分類をやってみた。WEBカメラに写ったモノ(ペットボトル)を分類したり画像(戦闘機)を読み込んで何が写っているのかを分類する。ネットワークはGoogleNetで試したが複数のネットワークが可能
Jetson Nano 2GB 開発者キットでNVIDIAのAI入門コース(Getting Started with AI on Jetson Nano!)をやってみた。Jetson Nanoを購入したは良いけど、何から手を付ければ良いのか分からない人は、まずはこちらの入門コースをやってみるのが良いと思う。
NVIDIAのJetson Nano 2GB 開発者キットを購入したのでセットアップを行った。従来のメモリ4GBモデルのの廉価版で価格は7,000円前後とかなり安くなっている。メモリは2GBだがswap領域を拡大することで、学習速度は多少低下するがResNet-18で問題なく学習ができた。
人間の姿勢を推定する機械学習モデルのPoseNetをRaspberryPi 4Bで動かしてみた時の備忘録。PoseNetのPython版(Javascript版もある)をRaspberryPi 4Bにインストールして、ラズパイカメラ、そしてCoral USB Acceleratorで動かしてみた。
自宅のラズパイとモーションセンサー、カメラモジュールで製作した監視カメラのカメラが認識しなくなった。
自宅の監視カメラは動画を撮影した後、機械学習で動画に写っているオブジェクトを検知してオブジェクトが撮影されていればLINEで通知をする仕組みにしている。
結局、コネクター部の接触不良だったので接点復活剤で復活した
ケンブリッジコンサルタンツ(Cambridge Consultants)が安価なセンサーとカメラ(数千円程度とあった)のデータからAIを使って高解像度の深度データを生成するEnfuseNet(エンフューズネット)というシステムを開発したとのプレスリリース記事を見た。
GCP(Google Cloud Platform)のCloud Vision APIを使って複数の人物の写った写真の顔の表情から感情を分析した時の備忘録。日本人家族、外国人家族の2パターンの検出を行った。喜び、悲しみ、怒り、驚きの4種類の感情を分析すると同時に顔のパーツの写真上の座標を検出する。
GCP(Google Cloud Platform)のSpeech-to-Text APIを使って音声をテキストに変換した時の備忘録。自分の音声で自分の過去のブログの文書を読みあげて「滑舌の悪さ」「聞き取りやすい発音」「かんだり言いよどむ」など悪条件をどの程度クリアできるのかを試してみた。
最近のコメント