Advent Calendar 2021の読書感想文
これまで触れてきた技術とこれから触れていきたい技術|山田 周平|note
著者がこれまで触れてきた技術とこれから触れていきたい技術の列挙
Zero2Productionを読んでいる話
RustでWeb開発するぞーってなったプログラミング経験者が読むべきドキュメントの列挙
【Vertex AI】Workbench は革命児
Vertex AI Workbenchが今までのAI Platform Notebookと何が違うのか比較して新機能の紹介してる,わかりやすい
Deep Metric Learningによる、ホテルや飲食店などの拠点検索改善
ユーザーの検索クエリと正解の拠点をベクトル化してmetric learning
tf-idfやBM25+LightGBMからTransfomer Encoder+Contrastive Loss or Proxy Anchor Loss に改善
Tensorflowではモデルに文字列の正規化やSentencePieceによるToken ID列化といった前処理も含めてTensorflow Serving(TFS)でServingできます。つまりTFSの前段で別のAPIを構築して、前処理する必要がないということです。
内積を計算するところはABYSSを使用
量子ミドルウェアの有名どころをまとめてみた
量子ゲート型 回路生成/計算実行系, 量子ゲート型 目的特化系,アニーリング型向けの3つの分類でライブラリやSDKを紹介,openjijやawsのやつはなかったが,わかりやすくまとまっていた
OpenCV 4.5.4から実装された,YuNetによる顔とランドマークの検出cv::FaceDetectorYNの紹介
同じくOpenCV 4.5.4で実装されたSFaceによる顔の認識cv::FaceRecognizerSFは別記事で紹介するとのこと
YuNetは,顔を囲むバウンディングボックスと右目、左目、鼻、右口角、左口角の5点のランドマークを検出する(信頼度も)
動かす過程を紹介している,わかりやすい
YuNetは入力サイズによっては1.41[ms]で処理できるようです。めちゃくちゃ速いですね。1
ABEJAでインターンされてた方がどういう経緯でインターンを始めたか,どういう心持ちでインターンを受けてたとかがまとまっていた
使うのは訓練済みStyleGANだけ!? 追加訓練なしで複数の画像合成タスクを実現する
訓練済みのStyleGAN2を使って、パノラマ合成から顔の編集、Image to image translation的なことまで基本的に訓練なしでできる論文の紹介
タイトル:StyleGAN of All Trades: Image Manipulation with Only Pretrained StyleGAN
URL:https://arxiv.org/abs/2111.01619v1
出典:Min Jin Chong, Hsin-Ying Lee, David Forsyth; arXiv preprint arXiv:2111.01619
コード:https://github.com/mchong6/SOAT
BrainF**kの紹介
notionのdb, timeline,board, リンクドデータベースを使ってソシャゲのいろいろを管理した話
活用例として参考になった
rustをもともと勉強してた著者が兢プロに挑戦する前のアルゴリズム基礎を学んで得たもののまとめ
元の画像との近さを評価値として遺伝的アルゴリズムで画像生成
量子機械学習に特化したPennyLaneの紹介
デモが豊富 https://pennylane.ai/qml/demos_qml.html
Tensorflow や Pytorch といった古典機械学習SDKとの接続(インターフェース)が用意されている
記法がやや独特(Qnodeという概念があるため)
qiskitほど「何でも出来る」わけではない。qiskitにあって、PLにない機能もある
Hugging Face謹製のTrainerが結構便利というお話
Hugging Face謹製のTrainerについて紹介
pytorch lightningのTrainerっぽい?
Transformersと相性が良さそう
固有値・固有ベクトルの紹介と対角化のあれこれについて証明
「今年読んで面白かった本はなんですか?」LAPRAS社員に聞いてみた
公正な採用選考の基本 | 厚生労働省に,家族に関すること や、 尊敬する人物に関すること,購読新聞・雑誌・愛読書などに関することなどが配慮すべき項目として挙げられていることを紹介してた
lapras社員11人が読んで面白かった本の紹介
・A/Dコンバータを用いた電流検出
サンプリング/変換の時間遅れ
量子化ビットエラー
・CPU内での計算
実行時間の遅延
丸め誤差
・PWM制御
キャリア信号/基準値の分解能
連続時間領域における制御ブロック図
デジタル時間領域におけるパルス伝達関数のブロック図
パルス伝達関数
z 平面での安定性
python controlを使用した時間領域における応答の図示
デッドビート制御の伝達関数とブロック図,時間応答の図示
colum2131さん
特徴量エンジニアリングについて,「(単一の)数値データ」「(単一の)カテゴリデータ」「テキストデータ」「数値データ × カテゴリデータ」「数値データ × 数値データ」「カテゴリデータ × カテゴリデータ」「スケーリング」の大きく7つの枠組みでどのような手法を取るかを紹介します.
+ 1subした後のコンペの進め方
数量・時間表現抽出ツールをPythonでゼロから実装してみた【NormalizeNumexp】
日本語自然言語内の数量表現や時間表現の抽出・正規化を行うOSSNormalizeNumexpの紹介と中身の紹介
DataRobot × Vertex Feature Storeで実現するオンライン推論
機械学習モデルの学習時はbqみたいな大量データを扱えるデータレイク,推論時は少量のデータを高速に取り出すredisみたいなKVSが必要で,異なる性能要件のストレージやデータベースが必要
そういった課題を解決するために生まれたのがFeature Storeで,Google CloudではVertex Feature Storeとして爆誕している
Vertex Feature Storeの紹介リンク複数紹介
tokyoリージョン内のfeature storeからcompute engineに特徴量取得して,usリージョンのdatarobotで推論,特徴量取得にかかる時間と特徴量取得+推論にかかる時間を計測
datarobotでモデル作ってデプロイするまで,feature storeにデータ入れるまでの過程
計測
クラウドで展開される量子プラットフォームサービスの現状をまとめてみた
Amazon Braket, Azure Quantum, Google Cloudでできることの紹介
前回の続き
OpenCV 4.5.4で実装されたSFaceによる顔の認識cv::FaceRecognizerSFの紹介
SFaceでは顔画像から128次元の特徴を抽出、別の顔画像から抽出しておいた特徴と比較することでスコアを出します。
generate_aligned_faces.py ... 画像から顔を検出して切り出し、顔画像として保存する
generate_feature_dictionary.py ... 顔画像から特徴を抽出、特徴辞書として保存する
face_recognizer.py ... 入力画像から顔を検出し特徴を抽出、特徴辞書と比較して顔認識する
認識+個人識別ができるっぽい
画像の回転はData Augmentationでは一般的な方法ですが、物体検出では思わぬ副作用があります。物体検出におけるBounding Boxの回転について、問題点を指摘しより正確な回転方法や損失関数を提案、ICCV2021にアクセプトされた論文です。
タイトル:Towards Rotation Invariance in Object Detection
URL:https://openaccess.thecvf.com/content/ICCV2021/html/Kalra_Towards_Rotation_Invariance_in_Object_Detection_ICCV_2021_paper.html
出典:Agastya Kalra, Guy Stoppi, Bradley Brown, Rishav Agarwal, Achuta Kadambi; Proceedings of the IEEE/CVF International Conference on Computer Vision (ICCV), 2021, pp. 3530-3540
プロジェクトページ:https://github.com/akasha-imaging/ICCV2021
今までのbboxの回転は,回転したbboxを内接する長方形を新たなbboxとしていたが,余白が大きく精度が下がる
提案されたbboxの回転は,元のbboxに内接する楕円を考えて,元のbboxに内接する楕円を回転させた後,その楕円が内接する長方形を新たなbboxにする
回転の不確実性を考慮した、独自の損失関数を定義
回転に対してロバストなモデルができる
斜めのbboxを扱えるモデル構造ってないのかな
概要
- ターゲットとメッセージを考える
- 伝えたいことに関連しそうな内容をとにかく沢山書く
- ストーリーラインをつくる
3-1. 視聴者からみて一連の流れになっているか
3-2. 視聴者からみて構造的な話になっているか - スライド化する
- スライドの質を高める
おわりに
Apache Pulsar Meetupの発表内容とヤフーにおける2021年のOSS/コミュニティー活動まとめ
Apache Pulsar Meetupの発表内容とヤフーにおけるApache Pulsarの2021年のOSS/コミュニティー活動まとめ
Apache Pulsar以外のOSS/コミュニティー活動の紹介はなかった
BLE(Bluetooth Low Energy)を人力で解析する
BLEを人力で解析してマグウォーマーの温度調整をするPCアプリをpythonで作った話
21卒はてなエンジニアの方が入社してから書いていた分報の行数をperlで集計,gnuplotでグラフ化した話
さくらインターネット(インフラ屋さん)からみた,サーバー管理者、アプリケーション開発者がいる環境で、 Docker を使うと何がうれしいのかをまとめた話
わかりやすかった
固有値の大小関係と面白い現象について適当に列挙した半分メモ的な記事
最初に出てくる量子状態の表現方法(線形重合せ、bra-ket)と基本操作であるパウリゲート(XZY)についてまとめた記事
重ね合わせを線形代数で表す記法(bra-ket記法)の紹介とパウリゲートの紹介
わかりやすかった
【Hydra+wandb+etc..】研究室で利用している機械学習実験環境について(追記予定です.)
2021/12/06時点で未完,追記予定とのこと
hydraでパラメータ管理,wandbで実験管理,dvc(https://dvc.org/)でデータのバージョニング
u++さんの毎年のやつ
notionのシンプルテーブルで列,行がドラックドロップできる
国土地理院のオープンデータをobj形式に変換して3Dにして表示
国土地理院API,open street apiの紹介,Geolonia 住所データをつかったジオコーディングの実装の紹介
AnT:Transformerを使ったアニメーションの線画着色の自動化の論文紹介
1フレームの線画とカラー画像が参照データとして与えられます。次に複数のフレームの線画が与えられます。これらの複数線画に対して、最初の線画-カラー画像と同じように自動着色するアプリケーションを作りましたというのがこの論文の趣旨です。ICCV2021に採択されています。
タイトル:The Animation Transformer: Visual Correspondence via Segment Matching
URL:https://openaccess.thecvf.com/content/ICCV2021/html/Casey_The_Animation_Transformer_Visual_Correspondence_via_Segment_Matching_ICCV_2021_paper.html
出典:Evan Casey, Víctor Pérez, Zhuoru Li; Proceedings of the IEEE/CVF International Conference on Computer Vision (ICCV), 2021, pp. 11323-11332
プロジェクトページ:https://github.com/akasha-imaging/ICCV2021
アプリ:https://cadmium.app/
前フレームとの一致をattentionでやりましたって感じっぽい
24時間の開発にモブプロを取り入れてみた(Internal Hack Day編)
Internal Hack Dayでヤフーの入社してから2年の人たちのチームがオンラインでモブプロで開発した話
モブプロをどうやったか,モブプロのよかったところ,改善したいところ,その他モブプロ以外の工夫などが紹介されてた,よかった