Predict

A collection of 48 posts
TAIEX.s46_LSTM(3). Future select by Forest
Predict

TAIEX.s46_LSTM(3). Future select by Forest

使用決策樹回歸進行特徵選擇,並使用選擇的特徵來訓練 LSTM 模型。最後打印所選的特徵變數並顯示實際值和預測值的圖表。 import os import pandas as pd import numpy as np import matplotlib.pyplot as plt import matplotlib.dates as mdates from sklearn.metrics import mean_squared_error, mean_absolute_error from sklearn.preprocessing import MinMaxScaler from sklearn.ensemble import RandomForestRegressor from tensorflow.keras.models import
3 min read
TAIEX.s46_LSTM(2). Future select by Decision Tree.
Predict

TAIEX.s46_LSTM(2). Future select by Decision Tree.

使用決策樹進行特徵選擇,並使用選擇的特徵來訓練 LSTM 模型。 最後打印所選的特徵變數並顯示實際值和預測值圖 import os import pandas as pd import numpy as np import matplotlib.pyplot as plt import matplotlib.dates as mdates from sklearn.metrics import mean_squared_error, mean_absolute_error from sklearn.preprocessing import MinMaxScaler from sklearn.tree import DecisionTreeRegressor from tensorflow.keras.models import
3 min read
TAIEX.s45_LSTM. Adj_Close
Predict

TAIEX.s45_LSTM. Adj_Close

1. 特徵工程:使用 Adj_Close 計算移動平均線(MA7 和 MA21)、RSI 和 MACD。 2. 特徵選擇:使用隨機森林模型選擇最重要的特徵。 3. 數據標準化:將特徵和目標變量標準化。 4. 創建序列:為 LSTM 模型創建時間序列數據。 5. 構建 LSTM 模型:使用選擇的特徵來訓練 LSTM 模型。 6. 預測和評估:進行預測並計算誤差(MSE 和 MAE)。 7. 可視化:繪製實際值和預測值的圖表。 8. 打印特徵變數:打印所選的特徵變數。 source code import os import pandas as pd
3 min read
**TAIEX.ML.s14_Box Plot.箱型圖
Predict

**TAIEX.ML.s14_Box Plot.箱型圖

Box Plot Matrix Map 提供了對各變數數據分佈的直觀了解,有助於識別數據中的異常值和分佈特徵。通過觀察這些圖表,可以為後續的數據清洗和特徵工程提供參考。 Box Plot Matrix Map 圖表顯示了每個變數的數據分佈情況,其中包括中位數、四分位數範圍、異常值等信息。以下是圖表的摘要說明: 1. 數據範圍: * 大多數變數的數據範圍較小,集中在較低的數值區間。 * Volume 和 OBV 的數據範圍明顯大於其他變數,因此在圖表中顯示時有較大的差異。 2. 異常值(Outliers): * 幾乎所有變數都存在異常值,這些異常值顯示為圖表中的小圓點。 * 特別是 Volume、Band Width、MACD Line、Signal Line 等變數,異常值較多且分佈較廣。 3. 變數分佈: * 部分變數(如 Aroon Up、Aroon Down、RSI7、
2 min read
**TAIEX.ML.s13_Normality_Test.常態分配檢定
Predict

**TAIEX.ML.s13_Normality_Test.常態分配檢定

正常性檢驗結果顯示所有變數的 p 值均為 0,表明數據顯著偏離正態分佈。 這是正常的結果,因為股票市場數據通常不遵循正態分佈。 * P 值 (p-value):在統計檢驗中,P 值用於衡量觀察結果與零假設(通常是數據符合某種分佈,比如正態分佈)的偏離程度。當 P 值小於某個顯著性水平(如 0.05)時,我們通常拒絕零假設。 * 正常性檢驗:常見的正態性檢驗方法包括 Shapiro-Wilk 檢驗。在這種檢驗中,零假設是數據來自正態分佈。 在我們的檢驗中,所有變數的 P 值均為 0(或極小),這意味著我們有足夠的證據拒絕數據來自正態分佈的假設。這在股票市場數據中是正常現象,因為這些數據往往具有尖峰厚尾(leptokurtic)或偏態(skewness),不符合正態分佈。 # Sample data sampled_data = data.sample(n=
2 min read