數據工程師 | 統計碩士 | AWS SAA 認證
SQL, Java (CS 1A/B/C), ETL 流程
R, Python, 統計建模, 假設檢定
AWS SAA, S3, EC2, CloudFront
建立自動化資料管線 (Data Pipeline),利用 GitHub Actions 結合 Yahoo Finance API 對美台股市進行監測,其中採用狀態化管理歷史高點,當回撤每達 5% 門檻時,自動於隔日台股開盤前觸發 LINE 通知,屬無伺服器架構與端到端數據處理應用。
此案首先對資料編碼、標準化及SMOTE等ETL過程,接著採用 XGBoost 與 Stacking 等數個機器學習演算法,預測電信業顧客流失情形,最終可供使用者轉化為商業決策。
此專案採用 Python 併行/非同步設計,結合 HTTP requests、BeautifulSoup 解析與 SQLite 儲存,實現高併發抓取書籍銷售資料,並採用錯誤重試流程,以構建穩定資料Pipeline。