基本統計量に基づいた度数別数値パターン検索
お知らせ
♢2020年8月18日(火) 日本オラクル株式会社ホームページで紹介されました。
一橋大学、小・中・高での統計教育の発展に貢献する「基本統計量に基づいた度数別数値パターン検索」にオラクルの自律型データベースを活用
https://www.oracle.com/jp/corporate/pressrelease/jp20200818.html
検索システム
https://trfrx9defnqboho-hito2uadw01.adb.ap-tokyo1.oraclecloudapps.com/ords/f?p=103
Username:
hituacjp
Password:
hituacjp
概要
統計教育や実証研究に役立つサンプルデータを作成するため、平均、分散、標準偏差、歪度及び尖度を用いた度数別の数値パターンデータベースを構築し、基本統計量に基づいた数値パターンを抽出するためのWebシステムです。このWebシステムの数値パターンは、整数値の組み合わせであるが、抽出後の数値パターンを最適化することにより、オリジナルデータに近似させることができます。
度数別数値パターンの検索
検索システム画面イメージ
範囲検索(Range Search)
FREQ(度数):2から100までの正の整数を入力
DEV%ile(標準偏差%ile):0から100までのパーセンタイルを含む任意の範囲(実数)を入力
SKEW(歪度):歪度の値を含む任意の範囲を入力
KURT(尖度):尖度の値を含む任意の範囲を入力
範囲検索(Range Search, 100 Results)
1. 範囲検索(Range Search)の検索に時間が掛かる場合、100レコードのみ検索する。
近似値検索(Approximation Search, Dev%ile)
検索したい標準偏差のパーセンタイルを入力することで、データベースに保存されている近似値(入力値の上下の二値)を抽出する。
近似値検索(Approximation Search, Skew)
検索したい歪度を入力することで、データベースに保存されている近似値(入力値の上下の二値)を抽出する。
近似値検索(Approximation Search, Kurt)
検索したい尖度を入力することで、データベースに保存されている近似値(入力値の上下の二値)を抽出する。
標準偏差パーセンタイルの計算
最適化
検索結果の数値パターンを利用して、オリジナルデータに近似した実数値にMS-EXCELのソルバーの機能を用いて最適化する。
〇最適化事例(MS-EXCEL ソルバー使用)
開示されている統計量からオリジナルのデータを求める。
度数
合計
分散
標準偏差
歪度
尖度
5
100
116.488
10.793
-0.913969483
1.8783073583892
(参考)
X1
X2
X3
X4
X5
合計
オリジナル
34.1
24.5
21.9
18.4
1.1
100
統計量に基づき、Webシステムから数値パターンを抽出
X1
X2
X3
X4
X5
合計
DB検索結果
34
25
21
19
1
100
MS-EXCELのソルバーの機能を利用して、オリジナルデータに近似した数値を推計
X1
X2
X3
X4
X5
合計
最適化結果
34.0622
25.0083
20.9386
18.8991
1.09184
100
詳細は、下記EXCELファイルを参照してください。
最適化事例.xlsx
参考文献
Kiyomi Shirakawa, Yutaka Abe, Shinsuke Ito,
"Empirical Analysis of Sensitivity Rules: Cells with Frequency Exceeding 10 that Should Be Suppressed Based on Descriptive Statistics,"
In: Josep Domingo-Ferrer and Mirjana Pejić-Bach eds., Privacy in Statistical Databases: UNESCO Chair in Data Privacy, International Conference, PSD 2016, Dubrovnik, Croatia, September 14 - 16, 2016, Proceedings, Springer, 2016, pp.28-40