対策まとめはこちら。
カンペまとめはこちら。
ライブラリ
- NumPy
- ナムパイ
- 線形代数用のライブラリ。
- scikit-learn
- サイキットラーン
- 機械学習用のライブラリ。
- SciPy
- サイパイ
- 確率統計用のライブラリ。
- seaborn
- シーボーン
- グラフを描くためのライブラリ。
統計
- 記述統計
- 代表値を計算したり傾向を分析したりし、手元のデータの分析を行うこと。
- 推計統計
- 手元のデータの背後にある母集団の性質を予測すること。
- 偏回帰係数
- 回帰分析において得られる回帰方程式の各説明変数の係数のこと。
- 偏相関係数
- 見かけ上の相関(疑似相関)が見られる場合に、他の変数の影響を除いて求める相関係数のこと。
- AIC
- Akaike’s Information Criteria、赤池の情報量規準
- 統計モデルの予測性能を観測値と理論値の差(残差)を用いて評価する。
- AIC = −2 × (最大対数尤度) + 2 × (パラメータの数)
- ベイズの定理
- 条件付き確率の公式。
- AのもとでBが起こる確率:P(Bi | A) = P(Bi) * P(A | Bi) / P(A)
精度・評価
- 正答率
- 全予測に対する正解率。
- 再現率
- recall
- 実際に正であるもののうち、正であると予測されたものの割合。偽陽性を減らすことを重視したい場合に採用する。
- 適合率
- precision
- 正と予測したデータのうち、実際に正であるものの割合。精度。偽陰性を減らすことを重視したい場合に採用する。
- F値
- 再現率と適合率の調和平均。
- 2*再現率*適合率/(再現率+適合率)
- MAE
- 絶対値平均
- 大きな誤差を少なく見積もることができ、目的変数の外れ値に影響を受けにくい。
- RMSE
- 平均二乗誤差
- MARに比べて誤差を大きく見積もってしまう。
- 停留点
- 臨界点
- 局所最適解でも大域的最適解でもないが、勾配が0(関数の導関数が0)になる点。鞍点は停留点の一つ。
- 鞍点
- ミニマックス点
- 停留点のうち極値を取らないもの。ある次元から見ると最小値であるが、別の次元から見ると最大値となるような点。
音声
- フーリエ変換
- 光や音のような波形データの周波数成分を抽出する解析に用いられる。音声をフーリエ変換することで得られたスペクトルにはいくつかのピークが見られる。
- フォルマント周波数
- 声道で発生する複数の共鳴周波数に対応する周波数。
- メル尺度
- mel尺度
- 音高尺度の一種。メル尺度の差と人が感じる音高の差が同じになるという性質を持つ。人間が知覚する音声の周波数は実際の周波数とは比例関係にはないため、音声認識においてメル尺度が用いられることが多い。MFCC(メル周波数ケプストラム係数)はメル尺度を音声認識の特徴量として変換したもの。
- サンプリング定理
- 標本化定理、Sampling Theorem
- 音声データをアナログデジタル変換して標本化(サンプリング)を行う際、音声データの周波数の2倍を超える周波数でサンプリングをすれば完全復元が可能。逆に、サンプリング周波数に対して1/2までなら再現が可能であり、サンプリング周波数の1/2の周波数のことをナイキスト周波数と呼ぶ。
その他
- カルマンフィルタ
- 状態空間モデルにおいて複数の不確実な情報からより正確な情報を推定する手法。カーナビゲーション等の位置更新アルゴリズムに用いられる。
- バイト単位
- ペタP、エクサE、ゼタZ、ヨタY
- IDCの調査によると、2017年の1年間に生成されたデジタルデータは23ZBであった。
0 コメント