「統計解析のはなし―データに語らせるテクニック」9章
大村平「統計解析のはなし―データに語らせるテクニック」日科技連 の読後行間補充メモ 同書籍は、印刷数表と手計算による統計解析を紹介した良書。 本稿では、同書籍の設例について、プログラムによる演算処理をした場合の例を示す。 コードと出力例は、Python[Google Colaboratory] 9章 なんでも数字で表す法 ~数量化のはなし~ p262 5段階評価 表9.1 等間隔目盛りで評価対象を測定する線形の評価。 平均値をまたいだ \(1\sigma\) の区間に約38パーセントの確率分布。 import numpy as np from scipy.stats import norm import pandas as pd import matplotlib.pyplot as plt p_inf = float('inf') # 無限大 # 設定値 mean = 0 # 平均 sigma = 1 # 標準偏差 # 領域の上限 up1 = -sigma *3/2 up2 = -sigma/2 up3 = sigma/2 up4 = sigma *3/2 up5 = p_inf up_list = [-p_inf, up1, up2, up3, up4, up5] # リスト化 # 領域の確率 area_prob = [] for up in range(len(up_list)-1): prob = norm.cdf(up_list[up+1], mean)-norm.cdf(up_list[up], mean) area_prob.append(round(prob*100,1)) # DF化 ## index生成 subject = "{}点クラス" point_list = ['1','2','3','4','5'] index_info = [] for point in point_list: class_name = subject.format(point) # 差込で語句生成 index_info.append(class_name) ## DF生成 DFw = pd.DataFrame(