致理科技大學
107
學年度第
2
學期課程教學計畫表
授課科目名稱
大數據數值分析與應用
授課教師
劉福音
課程時程
單學期-下學期
學分數
3.00
上課時數
3
開課系科
資訊管理系
課程性質
必修
開課學制
夜四技
開課班級
夜資二A
開課教室
圖書館大樓 501 電腦教室
(座位表查詢)
輔導時間
(每週4小時)
每週 (一) A09 - 16:20~17:10
每週 (一) X01 - 17:20~18:10
每週 (二) B01 - 18:20~19:05
每週 (二) B02 - 19:10~19:55
週別
主題與內容
週別
主題與內容
1
課程介紹 (含倫理教育主題)
10
大數據資料分析(spss統計分析)
2
資料科學與大數據資料認識
11
大數據資料分析(spss統計分析)
3
資料處理的基礎(問卷調查製作)
12
大數據資料分析(spss統計分析)
4
資料處理的基礎(問卷調查製作)
13
資料探勘與視覺化基礎(powerbi)
5
資料收集的基礎
14
資料探勘與視覺化基礎(powerbi),日間部畢業班期末考週
6
資料整理的基礎
15
資料探勘與視覺化基礎(powerbi)
7
大數據資料處理的基礎
16
分組報告
8
大數據資料處理的基礎
17
分組報告, 進修部畢業班期末考週
9
期中考週
18
期末考週
教材/課本
課堂宣布
敬請老師提醒同學遵守智慧財產權觀念,不得不法影印教科書!
授課方式
課堂教學+小組討論
是否為全外語教學
否
輔導證照
是-ICT或企業電子化資料分析師-巨量資料處理與分析(DPA)或其他證照,通過證照且無扣考者期末考100分.不同課程要考不同證照.不能共用.
輔導競賽
否
業師協同教學
無
是否為創新創業課程
否
是否為SDGs永續課程
否
成績比率
平時:
%
期中:
%
期末:
%
備註一
如因疫情臨時停課,線上同步教學網址:
備註二
依學生學習能力與教學進度,保留調整彈性
聯絡方式
研究室位置:
研究(辦公)室電話:(02)2257-6167 轉
E-Mail:
課程名稱:
大數據數值分析與應用
授課教師:
劉福音
課程簡介(以100至200字為原則):
1.了解何謂大數據 2.了解大數據於企業營運上之應用 3.了解大數據之系統性分析手法 4.了解如何分析資料,進行決策
Course Title:
Big Data Analytics and Application
Instructor:
Brief Introduction of Course Contents:
1.Understand what big data is 2.Understand the big data in the operation of the enterprise application 3.Understand the big data of systematic analysis techniques 4.Learn how to analyze data and make decisions
課程專業英文關鍵字:
人工智慧(Artificial Intelligence) – 研發智慧型機器和智慧軟體,這些智慧設備能夠感知周遭的環境,並根據要求作出相應的反應,甚至能自我學習 大資料科學家(Big Data Scientist) – 能夠設計大資料演算法使得大資料變得有用的人 商業智慧(Business Intelligence) – 是一系列理論、方法學和過程,使得資料更容易被理解 分類分析(Classification analysis) – 從資料中獲得重要的相關性資訊的系統化過程; 這類資料也被稱為中繼資料(meta data),是描述資料的資料 雲計算(Cloud computing) – 構建在網路上的分散式運算系統,資料是存儲於機房外的(即雲端) 聚類分析(Clustering analysis) – 它是將相似的物件聚合在一起,每類相似的物件組合成一個聚類(也叫作簇)的過程。這種分析方法的目的在於分析資料間的差異和相似性 儀錶板(Dashboard) – 使用演算法分析資料,並將結果用圖表方式顯示於儀錶板中 資料聚合工具(Data aggregation tools) – 將分散於眾多資料來源的資料轉化成一個全新資料來源的過程 資料分析師(Data analyst) – 從事資料分析、建模、清理、處理的專業人員 資料清洗(Data cleansing) – 對資料進行重新審查和校驗的過程,目的在於刪除重複資訊、糾正存在的錯誤,並提供資料一致性 資料集(Data set) – 大量資料的集合 判別分析(Discriminant analysis) – 將資料分類;按不同的分類方式,可將資料分配到不同的群組,類別或者目錄。是一種統計分析法,可以對資料中某些群組或集群的已知資訊進行分析,並從中獲取分類規則。 網格計算(Grid computing) – 將許多分佈在不同地點的電腦連接在一起,用以處理某個特定問題,通常是通過雲將電腦相連在一起。 Hadoop – 一個開源的分散式系統基礎框架,可用于開發分散式程式,進行大資料的運算與存儲。 Hadoop資料庫(HBase) – 一個開源的、非關聯式、分散式資料庫,與Hadoop框架共同使用 HDFS – Hadoop分散式檔案系統(Hadoop Distributed File System);是一個被設計成適合運行在通用硬體(commodity hardware)上的分散式檔案系統 高性能計算(HPC: High-Performance-Computing) – 使用超級電腦來解決極其複雜的計算問題 物聯網(Internet of Things) – 在普通的設備中裝上感測器,使這些設備能夠在任何時間任何地點與網路相連。 鍵值資料庫(KeyValue Databases) – 資料的存儲方式是使用一個特定的鍵,指向一個特定的資料記錄,這種方式使得資料的查找更加方便快捷。鍵值資料庫中所存的資料通常為程式設計語言中基底資料型別的資料。 機器數據(Machine data) – 由感測器或演算法在機器上產生的資料 機器學習(Machine learning) – 人工智慧的一部分,指的是機器能夠從它們所完成的任務中進行自我學習,通過長期的累積實現自我改進。 MapReduce – 是處理大規模資料的一種軟體框架(Map: 映射,Reduce: 歸納)。 大規模並行處理(MPP: Massively Parallel Processing) – 同時使用多個處理器(或多台電腦)處理同一個計算任務。 中繼資料(Metadata) – 被稱為描述資料的資料,即描述資料資料屬性(資料是什麼)的資訊。 MongoDB – 一種開源的非關係型數據庫(NoSQL database) 多維資料庫(Multi-Dimensional Databases) – 用於優化資料連線分析處理(OLAP)程式,優化資料倉庫的一種資料庫。 多值資料庫(MultiValue Databases) – 是一種非關係型數據庫(NoSQL), 一種特殊的多維資料庫:能處理3個維度的資料。主要針對非常長的字串,能夠完美地處理HTML和XML中的字串。 NoSQL – 顧名思義,就是“不使用SQL”的資料庫。這類資料庫泛指傳統關係型數據庫以外的其他類型的資料庫。這類資料庫有更強的一致性,能處理超大規模和高併發的資料。 模式識別(Pattern Recognition) – 通過演算法來識別資料中的模式,並對同一資料來源中的新資料作出預測 半結構化資料(Semi-structured data) – 半結構化資料並不具有結構化資料嚴格的存儲結構,但它可以使用標籤或其他形式的標記方式以保證資料的層次結構 情感分析(Sentiment Analysis) – 通過演算法分析出人們是如何看待某些話題 信號分析(Signal analysis) – 指通過度量隨時間或空間變化的物理量來分析產品的性能。特別是使用感測器資料。 相似性搜索(Similarity searches) – 在資料庫中查詢最相似的物件,這裡所說的資料物件可以是任意類型的資料 模擬分析(Simulation analysis) – 模擬是指類比真實環境中進程或系統的操作。模擬分析可以在模擬時考慮多種不同的變數,確保產品性能達到最優 智慧網格(Smart grid) – 是指在能源網中使用感測器即時監控其運行狀態,有助於提高效率 空間分析(Spatial analysis) – 空間分析法分析地理資訊或拓撲資訊這類空間資料,從中得出分佈在地理空間中的資料的模式和規律 非結構化資料(Un-structured data) – 非結構化資料一般被認為是大量純文字資料,其中還可能包含日期,數位和實例。 多樣(Variety) – (譯者注:大資料4V特點之一) 資料總是以各種不同的形式呈現,如結構化資料,半結構化資料,非結構化資料,甚至還有複雜結構化資料 高速(Velocity) – (譯者注:大資料4V特點之一) 在大資料時代,資料的創建、存儲、分析、虛擬化都要求被高速處理。 真實性(Veracity) – 組織機構需要確保資料的真實性,才能保證資料分析的正確性。因此,真實性(Veracity)是指數據的正確性。 視覺化(Visualization) – 只有正確的視覺化,原始資料才可被投入使用。這裡的“視覺化”並非普通的圖型或圓形圖,視覺化指是的複雜的圖表,圖表中包含大量的資料資訊,但可以被很容易地理解和閱讀。 大量(Volume) – (譯者注:大資料4V特點之一) 指數據量,範圍從Megabytes至Brontobytes
若有課程內容或排課問題,請洽課務組 日(02)2257-6167#1296、夜(02)2257-6167#1206
若有無法帳號密碼無法登入等問題或系統操作問題,請洽管理資訊組 (02)2257-6167#1286
若有點名系統相關問題,請洽 日生輔組(02)2257-6167#1213、夜學務組(02)2257-6167#1207