Книга (?) очень хорошо разжевывает работу cpu со своим кешем, с памятью, с соседними процессорами, как кеши остаются целостными, как поверх всего этого накручены атомарные операции и транзакционная память...
Не уверен, что я запомнил хотя бы 25% информации, но когда где-то будут встречаться статьи с обоснованием низкоуровневого перформанса чего-либо, в голове будут всплывать нужные воспоминания :)
Рекомендую к прочтению всем, кому интересно, откуда у процессора при большой нагрузке хватает времени и мультитредиться и поток операций паралелить и предугадывать что программа будет дальше запрашивать.