CHƯƠNG TRÌNH THẠC SĨ NGÀNH KHOA HỌC MÁY TÍNH

CHƯƠNG TRÌNH THẠC SĨ 
CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG
ĐỊNH HƯỚNG KHOA HỌC PHÂN TÍCH DỮ LIỆU
 
1. TỔNG QUAN VỀ CHƯƠNG TRÌNH
            “Data is the new oil.” (Clive Humby) .Khoa học phân tích dữ liệu (data science or data analytics) đã trở thành một lĩnh vực sôi động và hấp đẫn của tất cả các công ty trên toàn cầu, và có ảnh hưởng sâu sắc đến mọi lĩnh vực hoạt động của con người. “Without big data, companies are blind and deaf, wandering out onto the web like deer on a freeway.” (Geoffrey Moore, Wild Venture Partners.). Khoa học dữ liệu trở nên hấp dẫn là do khả năng tính toán của các thiết bị hiện tại được nâng cao cũng như khối lượng dữ liệu đủ lớn để đưa ra được các quyết định đúng đắn, những hiểu biết chính xác, và những thông tin đột phá.
Nắm chắc và biết sử dụng khoa học phân tích dữ liệu chính là chìa khoá của công việc và thành công trong những thập kỷ tới đây, như ý kiến nêu trong Harvard Business Review,  “Data scientist: the sexiest job of the 21st century”, Harvard Business Review. (“ Khoa học phân tích dữ liệu: công việc hấp dẫn nhất trong thế kỷ 21”).
Bắt đầu từ năm học 2015-2016, Chương trình Thạc sĩ Công Nghệ Thông Tin và Truyền Thông do Viện Viện John von Neumann (JVN) tổ chức cùng Trường ĐH Khoa học Tự Nhiên – ĐHQG HCM được cách tân, đi sâu vào hướng Khoa học Phân tích Dữ liệu. Chương trình này do chính GS.TSKH. Hồ Tú Bảo thiết kế và làm chủ nhiệm. GS. Hồ Tú Bảo là chuyên gia trong lĩnh vực máy học và khai phá dữ liệu, có nhiều năm kinh nghiệm điều hành chương trình Khoa học dữ liệu tại Viện Khoa học công nghệ tiên tiến Nhật Bản (JAIST).
Học viên hoàn thành chương trình Khoa học Phân tích Dữ liệu của viện JVN sẽ là những chuyên gia có:
  • Kiến thức cơ bản và chuyên sâu về phân tích dữ liệu,
  • Kỹ năng đặt và giải quyết vấn đề với các công cụ phân tích dữ liệu,
  • Có ít nhất 01 năm kinh nghiệm là Data Scientist/ Data Analysis.
2. CHƯƠNG TRÌNH ĐÀO TẠO
2.1. Chương trình Thạc sĩ ICT:
Chương trình Thạc sĩ ICT kéo dài 2 năm, bao gồm các học kỳ học lý thuyết (42 tín chỉ) và làm luận văn (tương đương 12 tín chỉ)
  • Năm Thứ Nhất: Học viên cần hoàn tất tối thiểu 27 tín chỉ (chưa bao gồm Triết học), trong đó có 21 tín chỉ bắt buộc và tối thiểu 06 tín chỉ tự chọn.
  • Năm Thứ Hai:
  • Học tại JVN: Học viên cần hoàn tất 01 môn Thực hành phân tích dữ liệu Doanh nghiệp (02 tín chỉ) và bảo vệ luận văn (12 tín chỉ). Ngoài ra học viên có thể học thêm các môn tự chọn nâng cao về Khoa học dữ liệu.
  • Chuyển tiếp theo bằng đôi với Télécom ParisTech (nếu đủ điều kiện): Sau khi hoàn thành chương trình học tại Télécom ParisTech, học viên cần hoàn tất luận văn có khối lượng tương đương 15 tín chỉ và bảo vệ tại Việt Nam để có thể nhận bằng Thạc sĩ ICT do Trường ĐH Khoa học Tự nhiên ĐHQG - HCM cấp.
2.2 Tổng quan chương trình Thạc sĩ ICT định hướng Khoa học Dữ liệu:

2.3. Mô tả môn học
1. Thống kê /Statistics
       • Objective: The course presents the foundations of statistics (estimation and hypothesis testing) and some important selected topics in statistics.
 
       • Content: Basis concepts of statistics, statistics models, estimation and hypothesis, parametric inference, Bayesian inference, The bootstrap, Linear and logistics regression, …(TBD).
 
Suggested textbook: Larry Wasserman (2014); All of Statistics: A Concise in Statistical Inference. Springer.
      
2. Fundamental of Linear Algebra and Optimization / Nhập môn Đại số tuyến tính và Lý thuyết tối ưu
       • Objective: The aim of this course is to provide the basic concepts and content of linear algebra and optimization used in data analytics. The learners are required to acquire basic concepts and methods of linear algebra and optimization and be able to use them in practice of data analytics.
      
       • Content: Basic concepts and content of linear algebra and optimization such as vector spaces, determinants, eigenvalues and eigenvectors, Symmetric Matrices and Quadratic Forms, linear transformations, basic issues in optimization…(TBD).
 
Suggested textbook:
       + Linear Algebra and Its Applications, 4th Edition by by Gilbert Strang, copyright 2005, Brooks/Cole;
       + Linear Algebra and Its Applications, 4rd edition by David C. Lay, copyright 2012, Addison-Wesley;
       + Data, Models, and Decisions: Bertsimas and Freund;
       + Numerical Optimization: Nocedal and Wright
(TBD).
      
3. Machine Learning and Data mining / Học máy và Khai phá dữ liệu
       • Objective: The aim of this course is to introduce to the basic methods of machine learning and data mining considered as the core of data analytics.
      
       • Content: Basic concepts and methods of machine learning and data mining, including data preprocesing, Decision tree induction, Evaluation of learning methods, Bayesian classification, Neural networks, Mining association rules, text and web mining... (TBD).
 
Suggested textbook:
       + Han, J. and Kamber, M. (2012). Data Mining: Concepts and Techniques
(Third edition), Morgan Kaufmann.
       + Mitchell, T. (1997). Machine Learning, McGraw Hill.
       + Stephen Marsland (2009). Machine Learning: An Algorithmic Perspective,
(TBD).
 
4. Database and Information System / Cơ sở dữ liệu và Hệ thống thông tin
       • Objective: This course prepares student to deal with large amount of data to be stored, transformed, searched and analyzed: modeling and designing the datawarehouse, ETL process, OLAP techniques.  Student will practice those techniques with a variety of software tools (Pentaho, Oracle). Student will also be prepared with new approach for information retrieval and data processing that uses massively parallel computation (MapReduce/ Hadoop).
      
       • Content: Relational database modeling (recall) and extended query language. Datawarehouse modeling, designing. Olap techniques. Data-intensive computing with MapReduce/Hadoop (structured and unstructured data).
 
Suggested textbook:
       + Jeffrey A. HofferV. RameshHeikki Topi.  Modern Database Management (11th Edition). Prentice Hall, 2012.
       + C. Imhoff, N. Galemmo, J.G.Geizer. Mastering Datawarehouse Design – Relational and Dimensional Techniques. Wiley Publishing Inc. 2003.
       +Ralph Kimball, Joe Caserta. The datawarehouse ETL toolkit: practical techniques for extraction, cleaning, conforming and delivering data. Wiley Publishing Inc. 2004.
(TBD).
      
5. Decision Analytics / Phân tích Quyết định
       • Objective: To describe the basic ingredients of decision theory and to apply the theory to a variety of interesting and important problems.
      
       • Content: Introduction to Decision Theory, Sensitivity Analysis, Utility Functions, Attitudes to Risk, Multi-Attribute Utility, Value of Information, … (TBD).
 
Suggested textbook:
       + Clemen, R.T. (1996). Making Hard Decisions: An Introduction to Decision Analysis (2nd Ed). Duxbury Press.
       + Lindley, D.V. (1991). Making Decisions (2nd Ed). John Wiley & Sons.
       + DeGroot, M.H. (2004).  Optimal Statistical Decisions (2nd Ed). John Wiley & Sons.
(TBD).
 
6. Visual analytics / Phân tích hiển thị dữ liệu
       • Objective: Visual analytics is an advanced form of information visualization, in which a
visualization process is created by integrating computational analysis and
information visualization. This course introduces students to a systematic use of
visualization techniques of visualization for supporting the data analytics process.
In this course, students learn how to transform information from a format
efficient for computation into a format efficient for human perception, cognition,
and communication; explore elements of computer graphics, human-computer
interaction, perceptual psychology, and design in addition to data processing and
computation.
      
       • Content: The Computer and the Human, Visualization of Numerical Data, Visualization of Non-Numerical Data, The Visualization Dashboard.
 
Suggested textbook:
       + Colin Ware (2012), Information Visualization, Third Edition: Perception for
Design (Interactive Technologies), 3rd Edition, Morgan Kaufmann
       + Tamara Munzner (2014), Visualization Analysis and Design, A K Peters/CRC
Press.
(TBD)
      
7. Skill for Data Scientists / Kỹ năng lao động mới
                    
8. Advanced machine learning and data mining / Học máy và khai phá dữ liệu nâng cao
       • Objective: The aim of this course is to introduce advanced methods of machine learning and data mining considered as tool s for big data analytics.
      
       • Content: An overview about statistical machine learning, kernel methods and support vector machines, dimensionality reduction, regresison, graphical models... (TBD).
 
Suggested textbook:
       + Hastie, T., Tibshirani, R., Friedman, J. (2009). The Elements of Statistical
Learning. Springer.
       + James, G., Witten D., Hastie, T, Tibshirani, R. (2014). An Introduction to
Statistical Learning with Application in R. Springer.
       + Murphy, K. (2012). Machine Learning: a Probabilistic Perspective, The MIT
Press.
       + Izenman, A.J. (2008). Modern Multivariate Statistical Techniques:
Regression, Classification, and Manifold Learning, Springer.
(TBD)
      
9. Thesis Proposal / Xây dựng đềcương luận văn
       • Objective: The aim of this course is to provide techniques and guidelines for writing a research proposal, research papers, and a thesis
      
       • Content: Proposal writing, Research paper writing, Practice on proposal and research paper writing, Thesis writing and scientific oral presentation, Actual work on a specific topic... (TBD).
 
10. Text & web analytics / Phân tích văn bản và web
       • Objective: The aim of this course is to provide techniques and algorithms for mining and analyzing text and web data.
      
       • Content: Introduction text and web analytics, Information extraction from text, Dimensionality reduction, Relation extraction and text classification, Topic modeling... (TBD.
 
Suggested textbook:
       + Aggarwal, C.C. and Zhai, C.X. (Eds.) (2013). Mining Text Data. Kluwer Academic.
       + Liu, B. (2007). Web Data Mining. Springer.
       + Some selected research papers.

11. Time series analytics and forecasting / Phân tích dữ liệu phụ thuộc thời gian và dự báo 

       • Objective: The first aim of this course is to look at the most common statistical methods for time series forecasting and signal processing. The later part of the course is more research-focussed. It will look at dynamic state space models as a general statistical model for describing systems that evolve in time, ending with an introduction to particle filters and sequential Markov chain Monte Carlo methods.
      
       • Content: Autoregressive models and seasonality, Autoregressive models and seasonality; Autoregressive models and seasonality; Holt-Winters models; Stationarity and autocorrelation; Moving average, ARMA and ARIMA models; Using R for time series analysis; The extended Kalman filter; The extended Kalman filter;... (TBD.
 
Suggested textbook:
+ Bishop, C. (2007).  Pattern Recognition and Machine Learning [Chapter 13]. Published by Springer.  
+ Shumway, R.H. and Stoffer, D.S. (2010).  Time Series Analysis and its Applications: with R examples.  Published by Springer.
+ Metcalfe, A. V., & Cowpertwait, P. S. (2009). Introductory time series with R. Published by Springer.
+ Coghlan, A. (2015).  A Little Book of R for Time Series.  Download at https://a-little-book-of-r-for-time-series.readthedocs.org.
+ Meinhold. R. and Singpurwalla, N.D. (1983).  Understanding the Kalman Filter.  The American Statistician, 37, 2: 123-137.
 

12. Advanced Data practice in Industry / Thực hành phân tích dữ liệu Doanh nghiệp 

       • Objective: The aim of this course is to provide practical knowledge for working as a Data Scientist or a Machine Learning Engineer in an industrial environment. Students will learn how to apply Machine Learning at a large scale, driving an AI product to production, and collaborating in a team.
      
       • Content: Engineering skills; How to do brainstorming & literature review in R&D task; Big data, Working in industry… (TBD.
 

13. Advanced Probability & Statistics / Xác suất và Thống kê nâng cao 

       • Objective: The course covers advanced statistical methods, including Bayesian statistics, computational statistics, nonparametric statistics. The outline below may marginally
evolve.
      
       • Content: Principle of Bayesian statistics, Monte Carlo methods for Bayesian inference, Markov Chain Monte Carlo methods, The bootstrap, Kernel density estimation, regression, Introduction to PyMC3 and its application, Gaussian and Dirichlet Processes, Variational Bayesian Inferences,… (TBD).
 
Suggested textbook: Larry Wasserman (2004). All of Statistics: A Concise Course in Statistical Inference. Springer
       CM Bishop, Pattern recognition and machine learning.


2.4. Đội ngũ giảng viên
Giảng viên
Đơn vị công tác
GS. Hồ Tú Bảo
Viện John von Neumann
GS. Cao Hoàng Trụ
Đại học Bách Khoa – TP.HCM
PGS. Hồ Bảo Quốc
Đại học Khoa học Tự nhiên - TP.HCM
PGS. Trần Minh Triết
Đại học Khoa học Tự nhiên - TP.HCM
PGS. Quản Thành Thơ
Đại học Bách Khoa – TP.HCM
TS. Brett HOULDING
Trinity College Dublin – Ai Len
TS. Bernardo NIPOTI
Trinity College Dublin – Ai Len
TS. Bùi Quang Paul
Viện John von Neumann
TS. Mai Hoàng Bảo Ân
Viện John von Neumann
TS. Hồng Trung Dũng
Công ty MoMo
TS. Lương Vũ Ngọc Duy
Viện John von Neumann
 
3. CƠ HỘI HỌC TẬP TẠI NƯỚC NGOÀI, CƠ HỘI NGHỀ NGHIỆP
Năm thứ hai học viên có cơ hội hoặc theo học và thực tập (có lương) tại Pháp nếu được nhận vào chương trình Master of Engineering (học 3 học kỳ và thực tập 1 học kỳ) hoặc Master of Science (học 2 học kỳ và thực tập 1 học kỳ) của Trường Telecom ParisTech, hoặc học trao đổi (2 học kỳ và 1 học kỳ thực tập) với trường Eurecom để nhận  bằng Thạc sĩ về Data Science and Engineering.
Tại Việt Nam, sau khi ra trường, học viên có thể định hướng:
  • Tiếp tục con đường nghiên cứu bằng việc làm nghiên cứu sinh. Ví dụ, vài cựu học viên JVN hiện làm nghiên cứu sinh thuộc các đơn vị/trường/viện là Télécom Paristech (Pháp), Trường ĐH Công nghệ Thông tin (Việt Nam), Viện Thông tin quốc gia Nhật Bản, École Polytechnique Fédéral de Lausanne (Thụy Sĩ), Chalmers University of Technology (Thụy Điển), University of Chicago (Mỹ),
  • Bên cạnh đó, các học viên khác có thể theo đuổi con đường trở thành chuyên gia trong lĩnh vực công nghệ thông tin tại các cơ quan, doanh nghiệp.
4. HỌC PHÍ VÀ HỖ TRỢ HỌC PHÍ
4.1. Học phí
- Học phí mỗi năm học là 50 triệu đồng. Nếu năm thứ hai học tại Pháp thì học phí là 20 triệu đồng.
- Đóng học phí theo từng học kỳ.
4.2. Chính sách hỗ trợ học phí
Học bổng Sau đại học JVN-LVCF: Học bổng toàn phần này được tài trợ bởi Quỹ Lương Văn Can, và dành cho tân học viên khóa 2018 có học lực xuất sắc hoặc/và có hoàn cảnh gia đình khó khăn. Trị giá học bổng lên tới 100% học phí trong 02 năm học chính quy, và được xem xét lại từng năm trên cơ sở kết quả học tập năm nhất.
- Đặc biệt năm 2018 Viện JVN tiếp tục tổ chức cuộc thi “Entropy – Khai phá dữ liệu”. Đây là cơ hội được miễn phí toàn bộ học phí khóa học dành cho học viên tham gia cuộc thi và đạt giải cao trong cuộc thi này.
Trong năm thứ hai, học viên học tại JVN có cơ hội được lựa chọn cùng tham gia làm đề tài hay dự án nghiên cứu từ các hoạt động hợp tác với doanh nghiệp, cơ quan về NCKH và nhận thù lao để hỗ trợ 1 phần học phí. Nếu số lượng đề án ít hơn số học viên có thể nhận thì ưu tiên giao cho những học viên có điểm trung bình cao nhất trở xuống trong năm thứ nhất.  
 

5. HỢP TÁC DOANH NGHIỆP
Tại viện JVN, các chương trình đào tạo và nghiên cứu kết nối mật thiết với hợp tác doanh nghiệp nhằm xây dựng chương trình học thiết thực. Đây cũng là kim chỉ nam của viện JVN là áp dụng mô hình tam giác tri thức: Đào tạo – Nghiên cứu khoa học – Đổi mới sáng tạo.
Viện JVN đã thu hút sự quan tâm của nhiều doanh nghiệp trong và ngoài nước, đặc biệt trong lĩnh vực ứng dụng Khoa học Dữ liệu. Hầu hết các học viên tại viện JVN đều tham gia vào các đề tài, dự án hợp tác với các doanh nghiệp ngoài thời gian học chính trên lớp. Những kinh nghiệm này vừa giúp học viên có thể áp dụng ngay những kiến thức đang học để thực hành trên những dữ liệu và nhu cầu thực tế đồng thời hỗ trợ một phần tài chính cho học viên.

 
TenPoint7
Tenpoint7
Glandore Systems
Glandore Systems 
Blueseed
Blueseed
 

GotIt!
GotIt!
IFI Solution
IFI Solution
Vinagame
Vinagame
 
Bạn đã không sử dụng Site, Bấm vào đây để duy trì trạng thái đăng nhập. Thời gian chờ: 60 giây
by duyetdev.com