参考サイト:Python 3 エンジニア認定データ分析 模擬試験

https://python.atelierkobato.com/meshgrid/

https://note.nkmk.me/python-pandas-set-index/

https://www.n-insight.co.jp/niblog/20190917-1351/

https://deepage.net/features/pandas-get-dummies.html

ジニ不純度
https://enjoyworks.jp/tech-blog/1134

ピアソンの積率相関係数
Pearson product-moment correlation coefficient
https://bellcurve.jp/statistics/glossary/1233.html

$$r_{xy} = \frac{{\displaystyle \sum_{i = 1}^n (x_i – \overline{x})
(y_i – \overline{y})}}{\sqrt{{\displaystyle \sum_{i = 1}^n
(x_i – \overline{x})^2}} \sqrt{{\displaystyle \sum_{i = 1}^n
(y_i – \overline{y})^2}}} = \frac{s_{xy}}{s_xs_y}$$

 1/xの積分公式の証明、絶対値がつく理由
https://mathwords.net/xbunno1sekibun

copyメソッドを利用して、値渡しが行われている
list3は値渡しのため、list1の要素の値の変更に影響を受けないことがわかります。
https://techacademy.jp/magazine/18988

クラスタリングとは?手法やメリット・デメリット、サーバクラスタリングの目的を徹底解説
https://bcblog.sios.jp/what-is-clustering-merit-demerit/

ハイパーパラメータのチューニング 【グリッドサーチの欠点とそれを補う手法を解説】
https://zenn.dev/yagiyuki/articles/0d6f97028fdd40209b7f

k近傍法(k-nn)…教師あり学習、分類の初期モデル構築 SMOTE
https://www.youtube.com/watch?v=7HEQy4BoBiQ
※k-means…教師なし学習のクラスタリング
https://aiacademy.jp/media/?p=254

Python, pip list / freezeでインストール済みパッケージ一覧を確認
https://note.nkmk.me/python-pip-list-freeze/
NumPy配列ndarrayを一次元化(平坦化)するravelとflatten
https://note.nkmk.me/python-numpy-ravel-flatten/

drop関数
axis 0または’index’
1または’columns’ (省略可能)初期値0
行データ(0または’index’)を削除するか列データ(1または’columns’)を削除するかを指定します。
https://deepage.net/features/pandas-drop.html

行列の掛け算

① 行列どうしのかけ算は、「左の列数」と「右の行数」が等しくないとかけ算できない

②「l 行 m 列の行列」と「m 行 n 列の行列」の積が、「l 行 n 列の行列」となる

https://atarimae.biz/archives/23930

2×2

 行列の積

[abcd][efgh]=[ae+bgaf+bhce+dgcf+dh]

https://www.headboost.jp/what-is-matrix-multiplication/

③行1列×1行③列=③行③列
⑩行5列×3行⑧列=⑩行⑧列
というように行・列とした時に両端の数字をとることで2つの行列の積の計算はできます。
https://detail.chiebukuro.yahoo.co.jp/qa/question_detail/q1259991442

AUC(Area under an ROC curve)となります。AUCが1に近いほど性能が高いモデルとなり、完全にランダムに予測される場合、AUCは0.5、つまりROC曲線は原点(0,0)と(1,1)を結ぶ直線になります。
https://www.randpy.tokyo/entry/roc_auc

numpy.concatenate
https://www.haya-programming.com/entry/2018/11/11/143147#numpyconcatenate

>>> a = np.array([[1,2],[3,4]])
>>> b = np.array([[5,6],[7,8]])
>>> np.concatenate([a,b])
array([[1, 2],
       [3, 4],
       [5, 6],
       [7, 8]])
>>> np.concatenate([a,b], axis=1)
array([[1, 2, 5, 6],
       [3, 4, 7, 8]])

numpy.reshapeメソッドの使い方
https://techacademy.jp/magazine/23868
mylist = np.array([1, 2, 3, 4, 5, 6, 7, 8])

mylist2 = mylist.reshape(2, 4)
print(mylist2)
実行結果は以下のようになります。

1次元目が2、2次元目が4のサイズの配列に変換されます。

[[1 2 3 4]
[5 6 7 8]]

dot積
https://study.prime-strategy.co.jp/coverage/py3an1-19/#:~:text=%E8%A7%A3%E8%AA%AC%E3%81%97%E3%81%BE%E3%81%99%E3%80%82-,%E3%82%B3%E3%83%BC%E3%83%89,-%E3%81%AE%E7%A2%BA%E8%AA%8D

(Ridge回帰, Lasso回帰)= (L2正則化項, L1正則化項)

pandasのデータ結合まとめ〜concat、merge
https://qiita.com/ctn15/items/3a119545c2340407fbc5

df.loc['Bob', 'age']

https://note.nkmk.me/python-pandas-at-iat-loc-iloc/

シェアする

  • このエントリーをはてなブックマークに追加

フォローする