Bài viết thăm dò của chú Ba nhận được hơn 300 comment nên hôm nay chú Ba viết bài phân tích về bài viết của tác giả ký tên Bá Linh, nick FB Nhà báo điều tra, về doanh thu vs tỷ lệ người xem phim Mai.
Các bạn đọc hình sẽ rõ chi tiết bài viết.Phân tích này nhằm giúp các bạn hiểu hơn về xác suất thống kê theo kiểu đời thường. Chú Ba sẽ không dùng các thuật ngữ chuyên môn.
Chú Ba cũng không bàn về sự chính xác của doanh thu phim Mai. Phe ủng hộ Trấn Thành thì đưa ra những dẫn chứng để chứng minh con số 300, 400 tỷ đó là đúng. Phe Anti Trấn Thành thì đưa ra nhiều lập luận để nghi ngờ.
Chú Ba chỉ nói thế này: Ngồi xuống, ăn một cái bánh, uống một ly trà, bình tĩnh suy nghĩ, gạt cảm xúc qua, sẽ tự phân tích ra con số doanh thu của Mai là đúng hay sai.
Trong bài này tác giả sẽ sử dụng con số doanh thu 367 tỷ đồng do TGBL đưa ra, và sẽ không bàn luận về tính chính xác của nó.
Trở lại bài viết ký tên Bá Linh, nick FB Nhà báo điều tra, về doanh thu vs tỷ lệ người xem phim Mai. Chú Ba tóm tắt ý chính như sau:
"Nếu doanh thu phim đạt 367 tỷ đồng, vé trung bình 100k, thì đã có 3,67 triệu người đi xem.
Chỉ có 11,85 triệu người thỏa mãn các yếu tố để xem phim, tức là 3 người sẽ có 1 người xem phim.
Tôi hỏi bạn bè đúng trong phân khúc này. Hỏi 10 người thì chưa ai xem phim cả."
Dưới đây là 3 phân tích của chú Ba.
1. Sai lớn: Xác định sai tổng số khách hàng tiềm năng.
Các bạn khởi nghiệp, startup khi trình bày về ý tưởng về doanh nghiệp thì thường có xu hướng, tăng độ lớn của khách hàng tiềm năng. Kiểu như Việt Nam có 70 triệu người lớn hơn 18 tuổi. Mỗi năm cứ 200 người mua sản phẩm của em thì năm đầu tiên em bán được ... Nhà đầu tư và những người hiểu biết sẽ nói luôn: "Em đừng đếm cua trong lỗ, vì có nhiều người, xét về độ tuổi, thu nhập, nhu cầu, hành vi... sẽ không là khách hàng tiềm năng của em."
Còn trường hợp của tác giả Bá Linh (viết tắt là TGBL) thì ngược lại. TGBL đã giảm tổng số khách hàng tiềm năng xem phim của Trấn Thành xuống còn 11,85 triệu người từ tổng số 100 triệu người Việt Nam.
Theo TGBL, thì chỉ những người trong độ tuổi 18 - 40 tuổi, và ở thành thị mới là khách hàng tiềm năng của phim Mai.
Kết luận này sai. Phân khúc: 18 - 40 ở thành thị, có thể là phân khúc lớn nhất nhì, có tỷ lệ người xem cao nhất nhì, nhưng vẫn còn những phân khúc khác vẫn là đối tượng xem phim Mai. Đó là các phân khúc sau:
1A) Người ở nông thôn vẫn chạy về thị trấn, huyện, thành phố để xem phim. Không thể bỏ qua tập này.
1B) Người trên 40 tuổi. Xem "ngon" nhen. Tập này số lượng lớn à.
1C) Người dưới 18 tuổi xé rào xem phim. Theo báo chí, Thanh tra Bộ Văn hoá đang tìm hiểu việc này.
Bỏ qua 3 tập này là sai lầm lớn của TGBL trong bài viết.
2. Một số sai sót nhỏ khác.
2A) Giá vé trung bình: 100k một phim. Muốn có số này chính xác thì phải lấy doanh thu của phim (không có bắp nước) chia cho tổng số vé. TGBL làm sao có được số này nên chỉ tính "rợ". Nên tôi nói là sai nhỏ.
2B) Số vé vs số người xem phim. TGBL đã sai khi cho rằng số vé bằng với số người xem phim. Thực tế, qua một số comment, thì có một tỷ lệ người xem lại nhiều lần.
Và dĩ nhiên có người mua vé, rồi không xem vì bận, vì giận người yêu, hay vì đọc review
2C) TGBL áp tỷ lệ độ tuổi cả nước và tỷ lệ dân thành thị để tính ra số 23,7 triệu người từ 15-59 tuổi ở thành thị là cách tính chưa chính xác.
2D) Từ con số 23,7 triệu người từ 15-59 tuổi ở thành thị đưa về con số 11,85 triệu người từ 18 - 40 tuổi ở thành thị là thiếu số liệu. TGBL chỉ nói 1 câu: Chiếu theo tỷ lệ dân số. Rất chủ quan, thiên kiến. TGBL viết bài theo kiểu xác suất thống kê mà lại không dẫn chứng theo XSTK
3. Sai trầm trọng: Chọn mẫu để khảo sát.
TGBL chọn bản thân mình và 10 người bạn, gọi là nằm trong tập tiềm năng, để khảo sát nhằm kiểm tra tỷ lệ người xem phim. Vì 11 người này chưa xem, khác với lập luận 3/1, nên TGBL kết luận: Lạ!
Việc chọn mẫu khảo sát là một nội dung cực kỳ quan trọng trong XSTK. Nguyên tắc của chọn mẫu là phải đủ lớn, và phải đại diện, tiêu biểu được cho tập lớn.
Tôi lấy 1 ví dụ hết sức đơn giản như sau. Tỉnh nọ có 2 triệu người. Số lượng nam là 1,02 triệu, chiếm 51% dân số. Nữ chiếm 49%.
Nhưng nếu người khảo sát đi vào doanh trại quân đội có 40K, đếm ra thì nam chiếm 85%. Ủa lạ vậy.
Hoặc nếu người khảo sát ở các nhà máy dệt may, với tổng số 15K công nhân thì sẽ kết luận nữ chiếm 78%. Ủa, kỳ vậy.
Còn đây là một ví dụ khác có thật.
Việc khảo sát dự đoán kết quả bầu cử tổng thống Hoa Kỳ là một việc quan trọng. Các tổ chức, viện nghiên cứu, báo chí đều muốn thực hiện việc này một cách nghiêm túc để đưa ra dự đoán chính xác nhất có thể. Tuy vậy lịch sử từng chứng kiến nhiều dự đoán sai lầm mà trường hợp dưới đây là một minh họa thú vị.
Nội dung dưới đây trích từ bài "Dự đoán bầu cử tổng thống Mỹ sai, vì sao?" ngày 12/11/2016 trên Báo Tuổi trẻ, do nhà báo Công Khanh tổng hợp từ báo chí nước ngoài.
"Cuộc bầu cử tổng thống Mỹ ngày 3-11-1936 là cuộc đua giữa hai ứng viên Franklin Delano Roosevelt (1882-1945) - đương kim tổng thống - và Alfred Mossman “Alf” Landon (1887-1987) - thống đốc bang Kansas.
Trước ngày bầu cử, tạp chí Literary Digest đã thăm dò ý kiến gần 10 triệu công dân Mỹ và dự đoán Alf Landon đắc cử. Ngược lại, Viện Gallup dựa vào ý kiến của “chỉ” 50 nghìn người để dự đoán Roosevelt tái đắc cử.
Giữa 10 triệu ý kiến và 50 nghìn ý kiến, con số thứ nhất rõ ràng có “sức nặng” hơn nhiều. Tuy nhiên, kết quả bầu cử chứng tỏ Viện Gallup đúng.
Thì ra, Literary Digest đã chọn mẫu có kích thước lớn nhưng không tiêu biểu vì chỉ phỏng vấn những công dân Mỹ có tên trong danh bạ điện thoại - những người thuộc tầng lớp trung lưu trở lên vào thời điểm ấy.
Trong khi đó, 50 nghìn người mà Viện Gallup phỏng vấn được chọn ngẫu nhiên và tiêu biểu cho nhân dân Mỹ. Kết quả này khiến George Gallup (1901-1984) - người sáng lập Viện Gallup - nổi tiếng đến nỗi tên ông trở thành đồng nghĩa với thăm dò dư luận."
Để dự đoán đúng thì mẫu khảo sát cần phải đủ lớn, và quan trọng hơn là phải có tính tiêu biểu cho tập mà chúng ta muốn khảo sát.
Việc TGBL chọn bản thân mình và 10 người bạn của mình để khảo sát tỷ lệ người xem phim Mai là rất SAI SAI trong xác suất thống kê. Nó không có tính khoa học.
+++ Kết luận 1:
Nói tóm lại bài viết của TGBL có 1 sai trầm trọng, 1 sai lớn và một số sai sót nhỏ. Bài này dùng để trà dư tửu hậu cho vui thì ok. Chứ viết lên FB như một bài nghiêm túc thì không ổn chút nào.
+++ Kết luận 2: Nếu đơn vị phát hành phim Mai, có công cụ thống kê: tuổi, nghề nghiệp, khu vực ... của người xem phim một cách đầy đủ, và họ chủ động khảo sát thì họ có thể vẻ ra chân dung của những nhóm khách hàng tiêu biểu của phim Mai.
Không có thống kê này thì mọi dự đoán, khảo sát chỉ có tính tham khảo.
Vậy nhé các bạn.
Cám ơn các bạn đã đọc bài. Nếu các bạn thấy bài có giá trị với mình thì hãy tương tác, thả tim, comment... để bài lan toả. Và kết bạn, follow chú Ba nhen!
Chú Ba tài chính
** Đối với chú Ba thì chuyện gì ra chuyện nấy. Chú Ba xếp hạng phim Mai 9.5/10 vì khả năng thương mại, hạng 8.5/10 nếu so sánh với các phim VN khác. Tuy vậy chú Ba vẫn có những ý kiến đóng góp về những điểm hạn chế của phim để mong phim VN có thể ra thế giới, được người nước ngoài xem nhiều hơn.
Chuyện thống kê này cũng vậy. Chú Ba thấy sai về dẫn dắt, về SXTK thì chú Ba lên tiếng, phân tích.
Viết FB có khi cần cảm xúc. Nhưng cũng có khi phải gạc cảm xúc, và dùng lý trí, kiến thức!