What do you think?
Rate this book


344 pages, Paperback
First published May 9, 2017
…people’s search for information is, in itself, information. When and where they search for facts, quotes, jokes, places, persons, things, or help, it turns out, can tell us a lot more about what they really think, really desire, really fear, and really do than anyone might have guessed. This is especially true since people sometimes don’t so much query Google as confide in it: “I hate my boss.” “I am drunk.” “My dad hit me.”There’s lies, damned lies and then there are statistics. One must wonder. Do the lies get bigger as the datasets grow? Seth Stephens-Davidowitz posits that the availability of vast sums of new data not only allows researchers to make better predictions, but offers them never-before-available tools that can offer insight that direct questioning never could.

"تحمل بعض المصادر المتصلة بالإنترنت الناس على الاعتراف بأشياء لا يعترفون بها في أي مكان آخر، أنها بمثابة مصل الحقيقة الرقمية. خذ عمليات بحث غوغل، وتذكر الظروف التي تجعل الناس أكثر صدقًا: متصلين بالإنترنت، وحدهم، لا يوجد شخص يجري دراسة استقصائية."
"لا يخبر كثير من الناس الدراسات الاستقصائية عن الأفكار والتصرفات المحرجة. يريدون أن يبدوا جيدين على الرغم من أن معظم الدراسات الاستقصائية لا تذكر أسماء الأشخاص وهذا ما يسمى بالانحياز للمقبول اجتماعيًا."
"يكذب الناس حول عدد الكؤوس التي احتسوها في طريقهم إلى البيت، ويكذبون حول عدد مرات ذهابهم إلى النادي الرياضي، وحول تكلفة تلك الأحذية الجديدة، وفيما إذا كانوا قد قرأوا ذاك الكتاب. يتصلون متعذرين بالمرض في حين أنهم أصحاء، ويقولون أنهم سيبقون على تواصل في حين أنهم لن يبقوا على تواصل، ويقولون أن الأمر لا يتعلق بك في حين أنه يتعلق بك، ويقولون أنهم يحبونك في حين أنهم لا يحبونك، ويقولون أنهم سعداء بينما هم تعساء، ويقولون أنهم معجبون بالنساء في حين أنهم معجبون في الحقيقة بالرجال. يكذب الناس على أصدقائهم، ويكذبون على رؤسائهم في العمل، ويكذبون على أطفالهم، ويكذبون على آبائهم، ويكذبون على أزواجهم، ويكذبون على زوجاتهم، ويكذبون على أنفسهم. ويكذبون بكل تأكيد على الدراسات الاستقصائية"
“Any time there is precise number that divides people into two different groups, a discontinuity, economists can compare, or regress, the outcomes of people very very close to the cut off.”
(1) It offers up new types of data (e.g., people's sexual desires and preferences gathered through porn sites).For all its weaknesses, some of which merely require some more attention and research, others of which are more fundamental, Stephens-Davidowitz should get credit for the work he has done on and with big data. I do agree with him that it's a very important source of information (which ought to be used with care, all the same) and tool for research, perhaps even—as he definitely seems to think—the most important in and for the future.
(2) It provides honest data (e.g., people's genuine concerns as expressed through questions asked in Google).
(3) It allows us to zoom in on small subsets of people (because there is so much data, even small slices of a population can provide meaningful [statistical] information).
(4) It allows us to do many causal experiments (e.g., presumable, through the kind of A/B testing done by Facebook and sellers of ads – this is, in my eyes, a problematic area that is not adequately addressed by S-D).