LOOP ( entrée manuelle de la référence Intel ) décrémente ecx / rcx, puis saute si elle est non nulle . C’est lent, mais Intel n’a-t-il pas pu faire vite? dec/jnz déjà macro-fusible en un seul uop sur la famille Sandybridge; la seule différence est que cela définit des drapeaux. loop sur diverses microarchitectures, à […]
Je suis confus sur le nombre de flops par cycle et par cœur pouvant être réalisés avec Sandy-Bridge et Haswell. Si je comprends bien avec SSE, il devrait être de 4 flops par cycle par cœur pour SSE et de 8 flops par cycle par cœur pour AVX / AVX2. Cela semble être vérifié ici, […]
J’ai besoin de travailler avec des exécutables Windows conçus pour x86, x64 et IA64. Je voudrais déterminer par programme la plate-forme en examinant les fichiers eux-mêmes. Ma langue cible est PowerShell, mais un exemple C # le fera. À défaut de cela, si vous connaissez la logique requirejse, ce serait formidable.
J’essaie de profiler et d’optimiser les algorithmes et j’aimerais comprendre l’impact spécifique des caches sur les différents processeurs. Pour les processeurs Intel x86 récents (par exemple, Q9300), il est très difficile de trouver des informations détaillées sur la structure du cache. En particulier, la plupart des sites Web (y compris Intel.com ) contenant des spécifications […]
Du 11ème chapitre ( Performances et évolutivité ) et la section intitulée Changement de contexte du livre JCIP : Lorsqu’un nouveau thread est activé, il est peu probable que les données dont il a besoin se trouvent dans le cache du processeur local. Par conséquent, un changement de contexte provoque une rafale de mémoire cache […]
Sur mon bureau, j’ai un petit widget qui indique mon utilisation actuelle du processeur. Il montre également l’utilisation de chacun de mes deux cœurs. Je me suis toujours demandé comment le processeur calcule la quantité de puissance de traitement utilisée. En outre, si le processeur est suspendu et effectue des calculs intenses, comment peut-il (ou […]
Dans un livre, j’ai lu ce qui suit: Les processeurs 32 bits ont 2 ^ 32 adresses possibles, alors que les processeurs 64 bits actuels ont un espace d’adressage de 48 bits J’espérais que s’il s’agissait d’un processeur 64 bits, l’espace d’adressage devrait également être 2 ^ 64. Alors je me demandais quelle est la […]
Je viens de mettre à jour mon logiciel iPhone 4S sur iOS 7 Beta 2 alors que j’étais en train de mettre la dernière touche à une nouvelle application (Phonegap)… pas une bonne idée! Après cela, Xcode n’a pas détecté mon iPhone, j’ai donc installé Xcode 5 beta. Après avoir bricolé avec ça, je l’ai […]
Quel est le coût de l’opération atomique (entre comparaison et échange ou ajout / réduction atomique)? Combien de cycles consum-t-il? Va-t-il mettre en pause d’autres processeurs sur SMP ou NUMA, ou va-t-il bloquer les access mémoire? Videra-t-il le tampon de réorganisation dans un processeur hors service? Quels seront les effets sur le cache? Je m’intéresse […]
Quelle est la différence entre un kernel et un processeur? Je l’ai déjà cherché sur Google, mais je ne fais que définir plusieurs processeurs et plusieurs processeurs, mais cela ne correspond pas à ce que je recherche.