Profile 03 00@2x

沈 浩 丞   Howard

⽬前就讀淡江統計系的⼤四學⽣,正在尋找以統計分析為職務核⼼能

⼒的職涯發展機會。


在學校有資料分析的經驗,曾經透過 Excel 處理台北捷運相關的數據

,分析出捷運松山線的建立是否影響了板南線的流量。具備資料預處

理和資料視覺化的能力。我認為從複雜的資料中找出重要的資訊是一

件非常有趣的事情,不僅提供決策者有客觀性的依據來判斷,同時還

可能從數據中了解到人們的行為,便於擬定政策。




求學經歷


淡江大學, 學士學位, 統計學, 2016 ~ 2020

Hvgzd756sdxsasxu4nhw

- 大四期間 

•  資料探勘 — 捷運松山沿線搭乘行為分析 (資料來源:台北市交通局)

在松山線建立後的一年間,發現到行駛於該條路上的主要公車,流量平均減少 15~20%,營收也減少了 15%。另外,我們使用統計方法(無母數檢定)發現遷入與遷出在建立前後的幾個月間產生劇烈的變化,可以推測新交通線的建立對於附近的人口、其他大眾交通運輸帶來明顯改變。

給予政府未來在考量建立新的路線時,可以藉由觀察其他大眾運輸的搭乘人口與該路線所經過的地區進行人口結構的評估。



- 大三期間 

•  迴歸分析 — 影響《英雄聯盟》職業選手勝率的各項數據進行分析

挑選出影響遊戲勝率的11項因子,將每項因子都視作成一個變數並建置模型,接著把訓練樣本帶入模型中進行預測,預測結果的模型配適率約為 40%。之後在將測試樣本帶入到模型中進行預測,模型得到的結果與真實生率相差過大,雖然包含在信賴區間內,但仍需考量更多因素已降低誤差。



•  存活分析 — 藥物濫用和預防 AIDS 之 UIS 臨床試驗 


•  比較兩地區的治療時間的長短是否能夠改善藥物濫用復發的時間
•  在其他因素中,是否存在著對藥物濫用復發時間有明顯的影響 

•  影響存活機率的原因除了治療時間的長短,年齡和有無腫瘤也影響甚大


- 大二期間 

•   資料分析 — 鞋子品牌間的喜好程度之分析 (使用Google表單進行資料的收集)

2017年世界十大運動品牌前三名分別為:Nike、Adidas、Reebok,資料中除了第三名(Under Armour)以外皆相符。但我們仍然可以發現,不愧是世界運動品牌的大宗 Nike,在大學生之

間的市佔率高達 45.39%,資料中沒有列入Reebok原因:對於台灣的年輕人來說,該品牌並

像前兩名較常見,因此在收集資料時並未納入考量。


其他經歷

台大新聞所資料工作坊(R軟體) 

 • 分析香港反送中事件相關tweets,從中了解資料分析常使用到的套件dplyr和ggplot2的使用

    方法,以及初步的社會網絡分析方法,例如:透過繪圖的方式了解到網軍之間的關聯性。

    透過這樣的關聯性更深入的探討是什麼樣的原因 會被歸類為網軍,最終發現在300

    資料中發現有1000多個帳號出現反送中的字眼,雖然結果相較於twitter官方所封鎖20萬

    個網軍帳號有所差距,仍舊學習到一些初步的文字探勘的技巧。

參與競賽

 2019 AI新銳領航者競賽 洞悉產業x驅動創新–長榮航空組

 • 使用 SAS Enterprise Guide 透過敘述性統計、統計繪圖、視覺化等分析方法,從各種面相了解

   資料樣態 ,以耗油成本控管為目標進行提案,其中以飛行時速和乘客數(重量:含行李)為油耗最

   為明顯的關鍵,由於飛行時數為不易更動的情況下,希望透過優惠的方式,以減輕重量為前提

   但又不減少乘客數,給予合適的建議並有效地控管成本。



技能                                                     證照


Python

SAS

R

Excel



SAS Certified Base Programmer for SAS 9


SAS Certified Advanced Programmer for SAS 9

自傳


個人特質:

        對於未知的事物感到非常有興趣,喜歡來自四面八方的挑戰,本身在思考事情上會考慮的較周全,做事情傾向於一步一步的邏輯推理。在團體中,擅長規劃與分析的角色,希望讓大家在做報告、專案有一個清楚的脈絡,並且釐清專案的目的性和實質意義,以便執行能夠提高效率。喜愛團體為某項事務共同努力的氛圍,透過分工、交流增進彼此的能力。遇到問題時,常透過網路或是社群相關的社團尋找是否有人遇到類似的情況和解決方案,在吸收他人的解決方法後,會試著去思考是否還有其他方式。

遇到無法處理的情況時,會詢問學長、老師們的經驗後,自己試著去修正遇到的問題,或是跳脫原本的框架重新判斷是否有更好的處理方式,保持釐清整件事的目的性。在接觸不熟悉領域時,會願意私下花時間鑽研,時常保持學習的狀態,讓自己可以隨時準備學習各方領域的知識,樂意學習新的事物,有積極解決問題的能力。 


求學歷程:


        在大學做報告的期間,我發現"玩數據"是一件很有趣的事,以市場導向來說,我們可以透過分析的結果來決定公司往後的決策該著重在什麼面向;在醫學方面,藉由分析得知藥物對於病人的效果是否明顯,決定該項藥物是否繼續開發。諸如此類的案例,分析的結果可以讓眾多不同的產業得到更棒的建議以及日後制定策略的方向,因此,這是我想要朝這分析這方面的主因。


        近年來,大數據、資料分析的領域越來越熱門,業界大多使用的程式語言為Python,在意識到這個情況後,透過學校的管道開始學習Python,由於過去學過其他的程式語言,因此較容易上手,希望未來在接觸工作時,讓自己更快步入軌道。在接觸過實務上的資料後,發現實務上的資料並不像學校提供的資料,大多都是結構化的形式且已經將資料整理完畢了。業界的資料通常需經過較繁瑣的手法來處理,才能夠得到我們想了解的資訊與目的。因此,判斷分析與建立模型的好壞,絕大部分都是取決於資料預處理能力的好壞,尤其是現今在數據越來越大的情況下,如何有效地從幾百萬筆、幾千萬筆的資料找出有意義的特徵並分析,是身為統計專業人士以及分析人員該具備的能力。過去,自己在這些方面的經驗較為不足,需要花更多的時間來學習。


未來展望:


        平時會查詢自己在寫程式遇到的瓶頸,像是 Stack Overflow、GitHub、Kaggle、Medium,這些網站都會有世界各國的人提供相關的程式碼以及解決問題的方法。除此之外,會去查看一些關於社會議題和涉及機器學習產業的時事以及分析報告,去了解那些專業人士是透過什麼方式來進行分析,不僅可以得知現在不同產業所面臨到的瓶頸,同時也能得知國際間所面臨的共同問題。未來希望能在實習上獲取更多不同產業的知識背景、提升資料預處理的能力和加強自己在資料分析上的實務經驗。 

Powered by CakeResumePowered by CakeResume
Powered by CakeResumePowered by CakeResume