The Pearl

The Pearl

Keep Discovering

**TAIEX.ML.s14_Box Plot.箱型圖
Predict

**TAIEX.ML.s14_Box Plot.箱型圖

Box Plot Matrix Map 提供了對各變數數據分佈的直觀了解,有助於識別數據中的異常值和分佈特徵。通過觀察這些圖表,可以為後續的數據清洗和特徵工程提供參考。 Box Plot Matrix Map 圖表顯示了每個變數的數據分佈情況,其中包括中位數、四分位數範圍、異常值等信息。以下是圖表的摘要說明: 1. 數據範圍: * 大多數變數的數據範圍較小,集中在較低的數值區間。 * Volume 和 OBV 的數據範圍明顯大於其他變數,因此在圖表中顯示時有較大的差異。 2. 異常值(Outliers): * 幾乎所有變數都存在異常值,這些異常值顯示為圖表中的小圓點。 * 特別是 Volume、Band Width、MACD Line、Signal Line 等變數,異常值較多且分佈較廣。 3. 變數分佈: * 部分變數(如 Aroon Up、Aroon Down、RSI7、
2 min read
**TAIEX.ML.s13_Normality_Test.常態分配檢定
Predict

**TAIEX.ML.s13_Normality_Test.常態分配檢定

正常性檢驗結果顯示所有變數的 p 值均為 0,表明數據顯著偏離正態分佈。 這是正常的結果,因為股票市場數據通常不遵循正態分佈。 * P 值 (p-value):在統計檢驗中,P 值用於衡量觀察結果與零假設(通常是數據符合某種分佈,比如正態分佈)的偏離程度。當 P 值小於某個顯著性水平(如 0.05)時,我們通常拒絕零假設。 * 正常性檢驗:常見的正態性檢驗方法包括 Shapiro-Wilk 檢驗。在這種檢驗中,零假設是數據來自正態分佈。 在我們的檢驗中,所有變數的 P 值均為 0(或極小),這意味著我們有足夠的證據拒絕數據來自正態分佈的假設。這在股票市場數據中是正常現象,因為這些數據往往具有尖峰厚尾(leptokurtic)或偏態(skewness),不符合正態分佈。 # Sample data sampled_data = data.sample(n=
2 min read
盛夏月亮
Essay

盛夏月亮

Date: 2024-06-30 夏夜星稀月更明 笑靨如花 水清波影 清雅如蘭悄然秀 芳華馥郁 時光且相迎 情意滿懷溢心間 芳華初綻放 怎能不心傾 盛夏時光如畫 我的眼角是滿滿的驕傲 且行且珍惜 情意滿懷溢心間 芳華初綻放 怎能不心傾 盛夏時光如畫景 帶著滿滿的驕傲 這裡總會有最溫暖的守候 盛夏時光歲月靜好 小月光輝 長照心間 如含苞的花朵 綻放無與倫比的美麗 我的小月光 我的小月亮
1 min read
Random_Forest(dft.3)_TAIEX_POC_0628
practice

Random_Forest(dft.3)_TAIEX_POC_0628

* n_iter=10:這意味著隨機搜索將嘗試 10 種不同的參數組合。您可以根據時間和資源的限制來調整這個數字。 * cv=3:使用 3 折交叉驗證來評估每個參數組合,這可以在保持模型性能評估的同時減少計算時間。 from google.colab import drive drive.mount('/content/drive') !pip install yfinance scikit-learn matplotlib statsmodels import yfinance as yf import pandas as pd import numpy as np import matplotlib.pyplot as plt from sklearn.preprocessing
6 min read