Thống kê học - Giới thiệu Thống kê học

Ánh nắng mặt trời và ung thư da Chứng cứ thuyết phục về mối liên hệ giữa việc tiếp xúc trực tiếp với ánh nắng mặt trời và ung thư da đã được một nhà thống kê người Úc phát hiện ra, Ông Oliver Lancaster. Ông quan sát thấy rằng tỷ lệ người bị ung thư da trong số dân da trắng gốc Bắc Âu có tương quan thuận với vĩ độ của nơi họ ở, tức có tỷ lệ với lượng ánh nắng mặt trời mà họ tiếp xúc: các tiểu bang ở phía bắc có tỷ lệ ung thư da cao hơn các tiểu bang phía nam. Quan sát này chỉ có thể đưa ra được bằng việc thu thập đầy đủ các số liệu và đưa ra các quan sát có phương pháp về tỷ lệ ung thư da. Đó là lý do tại sao cần học thống kê.

pptx45 trang | Chia sẻ: nhung.12 | Lượt xem: 1141 | Lượt tải: 0download
Bạn đang xem trước 20 trang tài liệu Thống kê học - Giới thiệu Thống kê học, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
Giới thiệu Thống kê họcwww.themegallery.comContents1. Click to add title in here 2. Click to add title in here 3. Click to add title in here 4. Click to add title in here 5. Click to add title in here 6. Click to add title in here Thống kê họcThống kê học là môn khoa học nghiên cứu hệ thống các phương pháp thu thập, xử lý và phân tích các con số (mặt lượng) của những hiện tượng số lớn để tìm hiểu bản chất và tính quy luật vốn có của nó (mặt chất) trong những điều kiện thời gian và địa điểm cụ thể. Thống kê họcVậy thống kê là gì? Đó là một ngành học giúp ta thực hiện những công việc sau: 1. Thu thập dữ liệu và thiết kế các nghiên cứu định lượng 2. Tóm tắt thông tin nhằm hỗ trợ quá trình tìm hiểu về một vấn đề hoặc đối tượng nào đó 3. Đưa ra những kết luận dựa trên số liệu, và 4. Ước lượng hiện tại hoặc dự báo tương lai Thống kê thường đi kèm với môn học song hành là Xác xuất, là ngành học nhằm đưa ra các mô hình toán học về sự ngẫu nhiên và cho phép tính toán về sự ngẫu nhiên trong những trường hợp phức tạp.Thống kê họcÁnh nắng mặt trời và ung thư da Chứng cứ thuyết phục về mối liên hệ giữa việc tiếp xúc trực tiếp với ánh nắng mặt trời và ung thư da đã được một nhà thống kê người Úc phát hiện ra, Ông Oliver Lancaster. Ông quan sát thấy rằng tỷ lệ người bị ung thư da trong số dân da trắng gốc Bắc Âu có tương quan thuận với vĩ độ của nơi họ ở, tức có tỷ lệ với lượng ánh nắng mặt trời mà họ tiếp xúc: các tiểu bang ở phía bắc có tỷ lệ ung thư da cao hơn các tiểu bang phía nam. Quan sát này chỉ có thể đưa ra được bằng việc thu thập đầy đủ các số liệu và đưa ra các quan sát có phương pháp về tỷ lệ ung thư da. Đó là lý do tại sao cần học thống kê.Thống kê họcwww.themegallery.comDữ liệuThống kêThông tinDataInformationStatisticsBa bước để làm thống kê01. Suy nghĩ03. Trình bày02. Biểu thịsuccessCác khái niệm trong thống kê họcQuần thể (population): một nhóm gồm các thành phần mà nhà thực hành thống kê quan tâm.VD: tất cả các nhà thầu ở Cần ThơMẫu (sample): một tập hợp các dữ liệu rút ra từ quần thể.Một mẫu 75 nhà thầu ở Cần Thơwww.themegallery.comCác khái niệm trong thống kê họcThông số (parameter): một đại lượng môt tả quần thể.VD: doanh thu bình quân của tất cả các nhà thầu là 100 tỷ đồngTrị (tham) số thống kê (statistic): một đại lượng mô tả mẫuVD: doanh thu bình quân của mẫu 75 nhà thầu là 120 tỷ đồng.www.themegallery.comCác khái niệm trong thống kê họcCác quần thể có các thông số; các mẫu có các trị số thống kê.Phương pháp thống kêPhương pháp thống kêThống kê mô tả(Desriptive statistics)Thống kê học suy luận(Inferential statistics)Thống kê mô tảThu thập số liệuVD: khảo sát, quan sát, thí nghiệmTrình bày dữ liệuVD: biểu đồ và đồ thịXác định đặc điểm của dữ liệuVD: trung bình của mẫuThống kê suy luậnQuá trình tạo ra một ước lượng, dự đoán, hay quyết định về quần thể dựa trên mẫu.Dữ liệu thống kêDữ liệu (Data): là đại lượng cùng ngữ cảnh đi kèm.Ngữ cảnh của dữ liệu: “Five W’s”: Who, What, When, Where and Why. Có thể có cả “How.”Dữ liệu không có ngữ cảnh đi kèm thì hầu như vô nghĩa.Dữ liệu thống kêHọ và tênTuổiLoại lao độngLương ngàyĐội thi côngBảo hiểmPham Cam18Phổ thông500001KhôngVũ Phu35Nề900001CóCao Giá28Nề950002KhôngTrần Ai45Sắt900001CóLê La30Điện850002CóLâm Tặc30Mộc900001KhôngNgô Khoai32Phổ thông450002Có Phạm Thượng11Phổ thông500002KhôngBiến của dữ liệuwww.themegallery.comĐịnh tính(Categorical)Định lượng(Quantitative)Biến của dữ liệuTrình bày dữ liệu định tínhBa qui tắc trong phân tích dữ liệuVẽ/tạo hình ảnh – có thể lộ ra những điều mà chúng ta không thấy từ dữ liệu thô.Vẽ/tạo hình ảnh – những đặc điểm quan trọng của dữ liệu sẽ được thể hiện. Chúng ta có thể thấy những điều chúng ta không mong đợi.Vẽ/tạo hình ảnh – cách tốt nhất để nói với người khác rằng dữ liệu của bạn có hình ảnh trình bày được lựa kỹ.Bảng tần suấtĐếm số lượng của các giá trị dữ liệu cho mỗi loại.Tổ chức chúng vào một bảng chỉ số đếm, thể hiện tổng số lượng và loại.Ví dụ hạng vé tàu Titanic:Hạng véĐếmHạng nhất325Hạng nhì285Hạng ba706Thủy thủ đoàn885Bảng tần suấtBảng tần suất tương đối cũng tương tự, nhưng thể hiện dạng phần trăm (thay vì số đếm) cho mỗi loại.Hạng vé%Hạng nhất14.77Hạng nhì12.95Hạng ba32.08Thủy thủ đoàn40.21Dự liệu tàu Titanic được trình bày hợp lý?www.themegallery.comBiểu đồ thanh (Bar Charts)Biểu đồ thanh tần suất tương đối mô tả sự phân phối tương đối của số đếm cho mỗi loại.Thỏa mãn “nguyên lý diện tích”Biểu đồ hình bánh (Pie Charts)Khi quan tâm các phần trong tổng thể, biểu đồ bánh là chọn lựa hay.Bảng tùy thuộcCho phép trình bày hai biến định tính cùng nhau.Cho phép thể hiện các thành phần được phân phối như thế nào theo mỗi biến, và tùy thuộc vào giá trị của biến khác.VD: xem xét hạng vé và sự sống sốt của hàng khách trên tàu TitanicHạngSống sótNhấtNhìBaThủy thủTổngSống203118178212711Chết1221675286731490Tổng3252857068852201Bảng tùy thuộcCác cột và hàng lề bên phải và bên dưới cho ra tổng số và các phân phối tần suất cho mỗi một biến.Mỗi phân phối tần suất gọi là phân phối lè của biến tương ứng.VD: Phân phối lề cho biến sống sót của tàu TitanicHạngSống sótNhấtNhìBaThủy thủSống203118178212Chết122167528673Bảng tùy thuộcMỗi phần tử của bảng cho ra số đếm của sự kết hợp giá trị của hai biến.VD: phân tử thứ hai ở cột thủy thủ đoàn chỉ ra 673 thủy thủ chết khi tàu Titanic bị chìm.HạngSống sótNhấtNhìBaThủy thủTổngSống203118178212711Chết1221675286731490Tổng3252857068852201Phân phối có điều kiện Phân phối có điều kiện cho ra phân phối của một biến chỉ cho các thành phần thỏa mãn một điều kiện nào đó của biến khácVD: phân phối có điều kiện của hạng vé với điều kiện sống.HạngSốngNhấtNhìBaThủy thủTổng20311817821271128.6%16.6%25.0%29.8%100%Phân phối có điều kiện Các phân phối có điều kiện cho thấy rằng có sự khác nhau về hạng vé và tỷ lệ sự sống sot.Phân phối có điều kiện Sự phân phối của hạng vé với người sống sót và sự phân phối của hạng vé với người không sống sót là khác nhau.Hạng vé và sự sống sót là có sự liên hệ, nhưng chúng không độc lập.Biểu đồ dạng thanh đốt Biểu đồ thanh đốt trình bày lượng thông tin giống với biểu đồ bánhBiểu đồ thanh đốt giữa hạng vé và sự sống sótPhân phối 1 biếnGiá trị trung bình      Ví dụVí dụ: Tính giá trị trung bình của tập hợp quan sát sau:inixi131422113312437Đáp số:  Ví dụVí dụ: Có 2 dự án với kết quả dự kiến:Dự ánLợi nhuận (tỷ) Xác suất (p)1900,3300,72600,5200,5Đáp số: Dự án 1: 48 tỷ; Dự án 2: 40 tỷTính lợi nhuận trung bình xác suất của 2 dự án trên.     Ý nghĩa Chú ý  Hệ số biến động CV Tính phương sai và độ lệch chuẩn với ExcelCác functions:Phương sai : Var (địa chỉ chuỗi)Độ lệch chuẩn: Stdev (địa chỉ chuỗi)www.themegallery.comCác phép biến đổi số liệu thường sử dụngwww.themegallery.comBiến trung tâm hóa và chuẩn hóaStandardized    Biến trung tâm hóa và chuẩn hóaNormalized   Biến trung tâm hóa và chuẩn hóaAdjusted Normalized  Ví dụTính giá trị phương sai (V) và từ đó suy ra giá trị độ lệch chuẩn của tập số liệu xi nói trêni131422113312437 Ví dụTính giá trị phương sai (V) và từ đó suy ra giá trị độ lệch chuẩn của tập số liệu xi nói trêni141422113312429 Ví dụVí dụ: Có 2 dự án với kết quả dự kiến:Dự ánLợi nhuận (tỷ) Xác suất (p)1900,3300,72600,5200,5 Ví dụVí dụ: Có 2 dự án với kết quả dự kiến:Dự ánLợi nhuận (tỷ) Xác suất (p)1900,3300,72600,5200,5

Các file đính kèm theo tài liệu này:

  • pptxchuong_1_77.pptx