Màu sơn nào có thể cho bạn biết một chiếc xe đã qua sử dụng vẫn còn trong tình trạng tốt? Làm thế nào các công chức ở thành phố New York có thể xác định các hố ga nguy hiểm nhất trước khi chúng phát nổ? Và làm thế nào những cuộc tìm kiếm của Google dự đoán được sự lây lan của dịch cúm H1N1?Chìa khóa để trả lời những câu hỏi này, và nhiều câu hỏi khác, là dữ liệu lớn. "Dữ liệu lớn" đề cập đến khả năng đang phát triển của chúng ta để nắm giữ các bộ sưu tập lớn thông tin, phân tích, và rút ra những kết luận đôi khi sâu sắc đáng ngạc nhiên.
Lĩnh vực khoa học đang nổi lên này có thể chuyển vô số hiện tượng - từ giá vé máy bay đến các văn bản của hàng triệu cuốn sách - thành dạng có thể tìm kiếm được, và sử dụng sức mạnh tính toán ngày càng tăng của chúng ta để khám phá những điều chúng ta chưa bao giờ có thể nhìn thấy trước. Trong một cuộc cách mạng ngang tầm với Internet hoặc thậm chí in ấn, dữ liệu lớn sẽ thay đổi cách chúng ta nghĩ về kinh doanh, y tế, chính trị, giáo dục, và sự đổi mới trong những năm tới. Nó cũng đặt ra những mối đe dọa mới, từ sự kết thúc không thể tránh khỏi của sự riêng tư cho đến khả năng bị trừng phạt vì những thứ chúng ta thậm chí còn chưa làm, dựa trên khả năng của dữ liệu lớn có thể dự đoán được hành vi tương lai của chúng ta.Trong tác phẩm thông tuệ tuyệt vời và gây nhiều ngạc nhiên này, hai chuyên gia hàng đầu giải thích dữ liệu lớn là những gì, nó sẽ làm thay đổi cuộc sống của chúng ta như thế nào, và những gì chúng ta có thể làm để bảo vệ chính mình khỏi các mối nguy hiểm của nó. Dữ liệu lớn là cuốn sách lớn đầu tiên về điều to lớn sắp diễn ra.”Bạn đọc có thể quét các QR Code bên trong sách và trên bìa sách để xem các đoạn phim minh họa.
Mở ra một vấn đề mình chỉ mới nghe tên và đóng lại mớ thắc mắc về những mẫu quảng cáo "khớp" hoặc trật lất một cách đáng kinh ngạc trong khi truy cập web của mình. Kiểu hôm trước mình mới tình cờ xem ảnh một cái áo dài màu đỏ son, và cố tình đọc lướt một bài báo giảm cân trên kênh lá cải. Thế là ngay hôm sau mình được chào mời gói "matxa giảm cân cho cô dâu" :)))) Ngặt cái trung tâm thẩm mĩ ấy không khuyến mãi một "chú rể" đi kèm nên... không thèm :| Cái gây bối rối nhất của Big Data, đấy không phải là "Tại sao" mà là "Cái gì", tức là nó tập trung vào kết quả hơn là nguyên nhân, nó đưa ra các dự báo chỉ dựa trên "dữ liệu lớn" chứ không phải "suy luận". Tuy nhiên, mình tự hỏi, thế đám kỹ sư của GG hẳn cũng phải suy luận gì đó khi viết thuật toán phân tích chứ nhỉ? Hẳn "cái gì" dành cho người sử dụng đầu cuối, còn "tại sao" là dành cho các kỹ sư đầu vào, còn "kiếm cả tỉ đô" lại dành cho nhà cung cấp và Google :3 Nếu không quá khập khiễng, có thể so sánh Big Data với hệ thống bói toán trong phương thức tác động của nó đối với người tiêu dùng. Bạn bước vào, cung cấp một lượng thông tin không nhiều (là bạn tưởng thế) về ngày sinh tháng đẻ, vị trí nốt ruồi, chỉ tay,... và bà thầy bói nói cho bạn biết bạn đang cần gì và bạn sẽ ra làm sao. Thực ra, cách bạn nói năng, di chuyển, câu hỏi của bạn, sắc mặt của bạn và người đi cùng... là những dữ liệu kèm theo, bà thầy bói sẽ tiến hành phân tích càng nhiều thông tin càng tốt bằng cách thuật toán riêng của mình. Thông tin càng nhiều, kết quả càng tốt, thuật toán càng hoàn hảo, danh tiếng bói đúng càng tăng, hiệu quả kinh tế càng cao... Là người xem bói, bạn không biết "tại sao", bạn chỉ có thể biết "cái gì như thế nào" và xùy tiền ra nếu nó đúng, dù chỉ một phần nhỏ :3
Big Data, tốt hay xấu, tùy đối tượng và quan điểm. Nhưng biết nhiều về nó thì... tốt. À, nhưng viết về Big Data hay bất kỳ cái gì mà rối rắm dài dòng như cuốn sách này thì... không tốt tí nào, trừ 1*!
Nội dung của cuốn sách về một vấn đề khá hay trong thời đại công nghệ và cách mạng 4.0. Tuy nhiên, cuốn sách thiếu sự mạch lạc trong nội dung dẫn dắt người đọc đến từng chủ điểm hoặc vấn đề xoay quanh dữ liệu lớn. Mình sẽ phải suy nghĩ xem tác giả muốn đề cập đến vấn đề gì ở đây và nội dung của từng đề mục khá là lặp đi lặp lại. Tuy nhiên, bạn cũng sẽ có được những cái nhìn sâu hơn vào khoa học dữ liệu và biết tương lai của chúng ta sẽ đi về đâu. Những vấn đề về đạo đức liên quan đến dữ liệu lớn có khả năng xuất hiện trong tương lai cũng sẽ giúp bạn có những cái nhìn mới xung quanh vấn đề nóng hổi này. Mình nghĩ là mình sẽ đọc lại cuốn sách này thêm một lần nữa để có thể hiểu được sâu sắc hơn nội dung mà cuốn sách muốn truyền đạt.
The book gives an overview about big data in our 4.0 generation. The information is easy to understand and read even when you're not working in science and technology firm. But the way author explain his ideas is too long and sometimes not necessary to repeat over and over the things we already know in the previous pages. Almost, I love the examples about big company (such as Google, Facebook, Amazon...) in this book. It expands my view about how data change the way we live and think (and also dangerous too).