что значит запуск игры без avx

Ускоряем неускоряемое или знакомимся с SIMD, часть 2 — AVX

Предыдущая часть вызвала бурную дискуссию, в ходе которой выяснилось, что AVX/AVX2 на самом деле есть в десктопных CPU, нет только AVX512. Поэтому продолжаем знакомиться с SIMD, но уже с современной его частью — AVX. А так же разберём некоторые комментарии:

Немного про AVX

AVX/AVX2 — это более мощная версия SSE, которая расширяет большинство 128 битных SSE операций до 256 бит, плюс приносит ряд новых инструкций.

Из тонкостей реализации можно выделить то, что на уровне ассемблера AVX использует 3 аргумента, что позволяет не разрушать данные в первых двух. SSE сохраняет результат в одном из аргументов.

Так же нужно учитывать, что при прямой адресации данные должны быть выровнены по 32 байта, в SSE выравнивание по 16.

Дополненная версия бенчмарка

Новые результаты выглядят так (-O0):

Итого суммарное ускорение в 9+ раз, AVX ожидаемо быстрей SSE почти в 2 раза.

В продакшн коде всё-таки лучше использовать _mm256_load_si256 вместо прямого обращения, этот вариант компилятор умеет лучше оптимизировать.

Влияет ли на скорость использование AVX команд над SSE регистрами?

-mavx2

_popcnt32(_mm_movemask_epi8(_mm_cmpeq_epi16(. ))) превращается в

-msse4.2

_popcnt32(_mm_movemask_epi8(_mm_cmpeq_epi16(. ))) превращается в

bonus

AVX команды _popcnt32(_mm256_movemask_epi8(_mm256_cmpeq_epi16(. ))) превращаются в

В одном из комментариев Antervis написал:

А еще, ты несколько недоработал алгоритм. Зачем делать через movemask + popcnt? Для массивов не более 2^18 элементов можно сначала собирать поэлементную сумму:
auto cmp = _mm_cmpeq_epi16(sseVal, sseArr);
cmp = _mm_and_si128(cmp, _mm_set1_epi16(1));
sum = _mm_add_epi16(sum, cmp);

а потом, в конце цикла, сделать одно горизонтальное сложение (не забывая про переполнение).

Источник

Cyberpunk 2077 «Обход проблемы AVX»

что значит запуск игры без avx. Смотреть фото что значит запуск игры без avx. Смотреть картинку что значит запуск игры без avx. Картинка про что значит запуск игры без avx. Фото что значит запуск игры без avx

Еще один энтузиаст представил собственное решение проблемы с вылетами для процессоров без поддержки AVX инструкций. Файл представляет собой простое редактирование исполняемого файла, позволяя игре работать на старых процессорах выпущенных до 2011 года. Фактически автор изменил значения «554881ECA00000000F2970E8» на «C34881ECA00000000F2970E8.

Вероятно, если вам не помог фикс AVX, этот файл может исправить ситуацию.

Альтернативное решение доступно здесь.

что значит запуск игры без avx. Смотреть фото что значит запуск игры без avx. Смотреть картинку что значит запуск игры без avx. Картинка про что значит запуск игры без avx. Фото что значит запуск игры без avx

что значит запуск игры без avx. Смотреть фото что значит запуск игры без avx. Смотреть картинку что значит запуск игры без avx. Картинка про что значит запуск игры без avx. Фото что значит запуск игры без avx

что значит запуск игры без avx. Смотреть фото что значит запуск игры без avx. Смотреть картинку что значит запуск игры без avx. Картинка про что значит запуск игры без avx. Фото что значит запуск игры без avx

что значит запуск игры без avx. Смотреть фото что значит запуск игры без avx. Смотреть картинку что значит запуск игры без avx. Картинка про что значит запуск игры без avx. Фото что значит запуск игры без avx

что значит запуск игры без avx. Смотреть фото что значит запуск игры без avx. Смотреть картинку что значит запуск игры без avx. Картинка про что значит запуск игры без avx. Фото что значит запуск игры без avx

что значит запуск игры без avx. Смотреть фото что значит запуск игры без avx. Смотреть картинку что значит запуск игры без avx. Картинка про что значит запуск игры без avx. Фото что значит запуск игры без avx

Как ты запустил скажи пожалуйста. Я перетащил экзешник в бин х64 и заменил на тот что был переименовал на Cyberpunk2077 и так же при запуске вылетает ошибка игра киберпанк прекратила работу

что значит запуск игры без avx. Смотреть фото что значит запуск игры без avx. Смотреть картинку что значит запуск игры без avx. Картинка про что значит запуск игры без avx. Фото что значит запуск игры без avx

ГДЕ AVX ПОКАЖИ ТКНИ. avx инструкций axx инструкций avx инструкций avx инструкций Никого не напоминает?

что значит запуск игры без avx. Смотреть фото что значит запуск игры без avx. Смотреть картинку что значит запуск игры без avx. Картинка про что значит запуск игры без avx. Фото что значит запуск игры без avx

Запускается, но через минуту после запуска играю или просто стою в уровне, игра зависает и через 30 секунд выкидывает. Xeon 2678v3 32Gb 1080TI. дрова актуальные.

Источник

Запуск игры без AVX — что это такое?

что значит запуск игры без avx. Смотреть фото что значит запуск игры без avx. Смотреть картинку что значит запуск игры без avx. Картинка про что значит запуск игры без avx. Фото что значит запуск игры без avxПриветствую ребята))

Коротко ответ: запуск игры на процессоре без поддержки AVX-инструкций. Обычно это старые процессоры, в итоге игра может работать, но возможно с меньшей производительностью.

Все современные процессоры поддерживают AVX. Вот например старый i7 2600K (1155 сокет) уже поддерживает AVX, но первую версию, а i7 860 (1156 сокет) — вообще не поддерживает, но правда он еще старее чем i7 2600K. Кстати легендарный процессор Q9650 (775 сокет) разумеется и близко не знает про AVX.

AVX — что это такое? Еще есть AVX2. Это улучшенные версии старых инструкций SSE. Простыми словами — это специальные инструкции, которые помогают процессору работать быстрее с некоторыми вычислениями. Они созданы как для процов Интел, так и для АМД. AVX расшифровывается как Advanced Vector Extensions.

Ну а что делают инструкции AVX? Все просто — процессор без поддержки AVX за один такт сможет сложить 1 пару чисел, а с поддержкой — уже 10. Однако это все нужно не так часто, как нам кажется, по большей части эффект заметен в профессиональных программах, а в играх не так заметно. Возможно современные игры уже больше могут использовать AVX.

Как узнать — поддерживает ли процессор AVX? Очень просто — скачайте бесплатную утилиту CPU-Z, она маленькая, неприхотливая, запустите ее и посмотрите какие инструкции поддерживает ваш проц:

что значит запуск игры без avx. Смотреть фото что значит запуск игры без avx. Смотреть картинку что значит запуск игры без avx. Картинка про что значит запуск игры без avx. Фото что значит запуск игры без avx

Вот выше на картинке — проц i5 7400, вполне современный, как видим он поддерживает и просто AVX и более новую версию AVX2. Впрочем ничего удивительного — i5 7400 это седьмое поколение, а это 2017 год.

Надеюсь данная информация оказалась полезной. Удачи и добра, до новых встреч друзья!

Источник

Avx ratio offset что значит

Особенности разгона

Напомню, что в первой части обзора мы изучили производительность самого быстрого настольного процессора в номинальном режиме. Прибавка в размере двух ядер, чуть более быстрая архитектура, а также частотный перевес позволили Core i7-6950X опередить бывший флагман — 8-ядерный Core i7-5960X — в многопоточных приложениях в среднем на 30-35%. Таков экстенсивный прогресс. И все же производительность чипов Broadwell-E реально увеличить при помощи разгона, благо все 14-нанометровые процессоры получили разблокированный множитель. Платформа ведь экстремальная.

Обзор Intel Core i7-6950X. Часть 2: разгон 10-ядерного процессора

В первой части я уже описал принцип работы Turbo Boost Max Technology 3.0. Полезная технология, ведь не всем приложениям необходима мощь десяти ядер. Иногда достаточно одного-двух, но очень быстрых. В подобных случаях драйвер (к сожалению,TBMT 3.0 не работает без софта) автоматически разгоняет одно ядро до 4 ГГц. В целом, как мы уже выяснили, в сложных многопоточных задачах Core i7-6950X функционирует на частоте 3,4 ГГц для всех десяти «голов». Если такую схему работы выдерживает система охлаждения, конечно же. Полный список характеристик приведен в таблице ниже.

Intel Core i7-6950X
Техпроцесс
Архитектура
Сокет, чипсет
Число ядер/потоков
Тактовая частота (Turbo Boost)
Кэш третьего уровня
Контроллер PCI Express 3.0
Контроллер памяти
Уровень TDP
Цена
Купить

Второе интересное нововведение — это детальная настройка каждого ядра в отдельности. Ничего особенного в самом процессе нет, но внедрение данной функции делает платформу LGA2011-v3 еще более гибкой в плане оверклокинга. Вкупе с TBMT 3.0, там, где не требуется мощь десяти ядер, реально подобрать высокие множители, характерные, например, для чипов Skylake для мейнстрим-платформы LGA1151. Напомню, что Core i7-6700K в дефолте работает на частоте 4 ГГц.

что значит запуск игры без avx. Смотреть фото что значит запуск игры без avx. Смотреть картинку что значит запуск игры без avx. Картинка про что значит запуск игры без avx. Фото что значит запуск игры без avx

что значит запуск игры без avx. Смотреть фото что значит запуск игры без avx. Смотреть картинку что значит запуск игры без avx. Картинка про что значит запуск игры без avx. Фото что значит запуск игры без avx

что значит запуск игры без avx. Смотреть фото что значит запуск игры без avx. Смотреть картинку что значит запуск игры без avx. Картинка про что значит запуск игры без avx. Фото что значит запуск игры без avx

BIOS материнской платы ASUS

Второе важное нововведение — это управление коэффициентом умножения ядер в моменты, когда софт задействует AVX-инструкции. В материнских платах ASUS данная функция получила название AVX Instructions Core Ratio Negative Offset, у GIGABYTE — AVX Offset, у MSI — CPU Ratio Offset When Running AVX. Как известно, именно векторные инструкции сильнее всего нагружают центральный процессор. Core i7-6950X — 10-ядерник, а потому в большинстве случаев основной причиной неудачного разгона станет именно недостаточная эффективность системы охлаждения. Опция снижения множителя в моменты, когда задействуются инструкции AVX, решает эту проблему. К тому же учтем, что в большинстве домашних задач, включая игры, векторный набор команд практически не используется.

Нет необходимости в AVX — и не включаем

Название опции в матплатах разное, но принцип работы везде одинаковый: мы указываем негативный коэффициент — множитель, на который будет снижена частота в моменты, когда задействуются AVX-инструкции. Например, если все десять ядер работают по схеме 100х45=4500 МГц, а offset-показатель равен пяти, то при запуске, например, LinX версии 0.6.5 и выше, задействующего векторные команды, скорость работы чипа автоматически снизится до 100х(45-5)=4000 МГц.

И вновь мы имеем дело с отличной кастомизацией рабочего процесса Broadwell-E. Кстати, нечто похожее происходит, если разгонять неоверклокерские чипы для платформы LGA1151. Пусть и с неохотой, но Intel позволила производителям матплат выпустить свои версии BIOS, разблокирующие частоту тактового генератора. Скорость работы чипов Skylake реально увеличить, но взамен у процессоров капитально «режется» производительность AVX-команд, что для игр — некритично.

Настройка множителя для AVX-команд

Новые процессоры получили большее количество делителей оперативной памяти. Например, чтобы разогнать «мозги» до эффективной частоты 3000 МГц вместе с процессором Haswell-E потребуется выставить параметр DDR4-2400, а скорость работы тактового генератора увеличить до 125 МГц. Контроллер памяти чипов Broadwell-E получил большее число делителей. Поддерживаются модули с эффективной частотой вплоть до 3800 МГц.

В тестовом стенде использовался 4-канальный кит Corsair VENGEANCE CMK32GX4M4B3000C15. Он работает на эффективной частоте 3000 МГц с таймингами 15-17-17-35 при напряжении 1,35 В. Общий объем — 32 ГБ.

Делители памяти для процессоров Intel Broadwell-E

Наконец, появилась возможность регулировать напряжение VccU. С его помощью оверклокер более точно управляет частотой кэш-памяти. Как видите, нововведений много. Все они направлены на то, чтобы сделать процессоры Broadwell-E еще эффективнее и быстрее во всех типах задач. Попробуем выжать из 10-ядерного Core i7-6950X несколько больше.

Результаты

Для охлаждения 10-ядерника подойдут только самые топовые системы охлаждения

Уже в номинале Core i7-6950X предъявляет серьезные требования к охлаждению. Если не использовать AVX-команды (LinX 0.6.4), то H110i GT удерживает температуру самых горячих ядер в пределах 50 градусов Цельсия. Если же применять векторные инструкции, то нагрузка на «водянку» заметно увеличивается — уже на 10 градусов Цельсия. Обращу ваше внимание, что в дефолтном состоянии Core i7-6950X работает с довольно низким напряжением 1 В. При этом, как я уже отмечал, под нагрузкой LinX 0.6.5 все ядра работали на частоте 3,4 ГГц.

Охлаждение Intel Core i7-6950X. Номинал

Разгон проводился в два этапа. Первый — самый простой. Я увеличил множитель с дефолтных 30 до 40 единиц, а напряжение — до 1,25 В. В итоге получил стабильную работу даже в LinX 0.6.5. Без троттлинга, хотя температура самых горячих ядер приблизилась к пиковым 100 градусам Цельсия. Любое последующее увеличение частоты приводило к перегреву. И это с H110i GT!

Второй способ заключался в поисках оптимального баланса частоты, с которым Core i7-6950X будет работать в софте, не использующем векторные инструкции. Она нашлась — 4,3 ГГц для всех ядер. Для этого я еще увеличил напряжение VCore, до 1,275 В. Стресс-тестирование в LinX 0.6.4 система проходила, а вот в LinX 0.6.5 постоянно докучал синий экран смерти. Пришлось воспользоваться функцией AVX Offset и снизить множитель для задач подобного рода сразу на пять единиц. Как видите, в самом начале появился троттлинг в размере двух процентов, но в целом система держала стабильные 3,8 ГГц для AVX и 4,3 ГГц — для всего остального. Даже с H110i GT допустимая температура держалась, как говорится, на тоненького. Без AVX десятиядерный процессор на частоте 4,3 ГГц в LinX 0.6.4 прогрелся всего до 80 градусов Цельсия. Разница колоссальная.

Охлаждение Intel Core i7-6950X. Разгон

10 ядер в разгоне — это не шутка. Увеличение «напруги» и частоты серьезно увеличили энергопотребление системы. Поэтому удивляться тому, что H110i GT еле-еле справляется с охлаждением оверклокнутого Core i7-6950X, не приходится.

Потребление энергии Intel Core i7-6950X

Так какой вариант разгона лучше? CINEBENCH и 3Ds Max рапортуют, что вариант с неравнозначным разгоном (общее — 4,3 ГГц; AVX — 3,8 ГГц) предпочтительнее. Софт не использует AVX, так что ничего удивительного нет.

Отмечу, что оверклок дает ощутимый прирост производительности. В том же CINEBENCH десять ядер, оверклокнутых до 4,3 ГГц, «привозят» номиналу аж 23,4%.

что значит запуск игры без avx. Смотреть фото что значит запуск игры без avx. Смотреть картинку что значит запуск игры без avx. Картинка про что значит запуск игры без avx. Фото что значит запуск игры без avx

Данный гайд поможет произвести настройку параметров UEFI BIOS для достижения стабильных 5 ГГц на разблокированных процессорах седьмого поколения Kaby Lake (Intel Core i7-7700K, Intel Core i5-7600K и Intel Core i3-7350K).

Немного практической статистики:

Какой вольтаж является нормальным для 5 ГГц?

Пожалуй, это один из самых главных вопросов, который энтузиасты задают в процессе разгона ЦП. Ведь именно этот параметр ключевым образом сказывается на стабильности и итоговом результате оверклокинга.

Для начала разберемся с уровнем энергопотребления Intel Core i7-7700K в разных режимах работы:

Для стабильной работы ЦП на 5 ГГц в тесте Prime95 (а значит и в большинстве наиболее часто используемых приложений) необходимо напряжение в 1,35 В (параметр Vcore в BIOS). Превышать это значение не рекомендуется, дабы избежать деградации процессора и перегрева.

Для стабильной работы ЦП на 5 ГГц в тесте Prime95 необходимо напряжение в 1,35 В.

Необходимо отметить, что процессоры семейства Kaby Lake крайне энергоэффективные. Для сравнения стабильный Skylake на 5 ГГц в схожих приложениях, например, Prime95 потребляет порядка 200 Вт.

Для охлаждения разогнанного Intel Core i7-7700K в процессе стресс-тестов понадобится мощная СО, это может быть либо СВО, либо производительный суперкулер.

Проверенные варианты:

Для постоянного использования Kaby Lake на 5 ГГц воздушного охлаждения недостаточно, но не стоит забывать про возможность оптимизации нагрузки. На полную мощность ЦП будет работать только в самых необходимых случаях (об этом ниже).

Разгон оперативной памяти

Отборные сэмплы Kaby Lake могут работать с четырьмя модулями памяти на частоте DDR4-4133.

Напоминаем, что процессоры Kaby Lake прекрасно работают с оперативной памятью на частоте DDR-4133 (проверено на семействе материнских плат ASUS ROG Maximus). Показатель в DDR4-4266 доступен на моделях ASUS Maximus IX Apex и ASUS Strix Z270I Gaming (все дело в двух коннекторах DIMM, которые оптимизированы для таких частот).

Но для повседневного использования не стоит использовать ОЗУ с частотой выше DDR4-3600; покорение 4 ГГц отметок на памяти оставьте энтузиастам, для домашней или игровой системы важнее общая стабильность ПК.

Главное не забывать про необходимость установки в слоты DIMM парных китов ОЗУ (то есть заводских комплектов, состоящих из двух или четырех модулей). Самостоятельно подобранные единичные варианты могут попросту не завестись на требуемых вам настройках, таймингах и т. п.

Параметр AVX offset

Эта опция помогает стабилизировать работу ЦП на высоких частотах, уменьшая рабочую частоту при обработке операций с кодом AVX.

Если зафиксировать множитель процессора на 50 единицах, BCLK – на 100 МГц, а параметр AVX offset на 0, результирующая частота в 5000 МГц будет постоянной. Но в таком случае система может оказаться нестабильной. И причину подобного поведения придется выявлять очень долго.

Именно поэтому опытные энтузиасты советуют воспользоваться опцией AVX offset, установив ее значение на 2. Это значит, что при постоянных 5 ГГц система автоматически уменьшит множитель до 48 пунктов (что соответствует 4800 МГц) в момент, когда будет замечена активность AVX приложений.

Подобный подход благотворно сказывается не только на стабильности работы ПК, но и на грамотном энергопотреблении, а значит и тепловыделении ЦП.

Опция AVX offset прекрасно зарекомендовала себя на практике; одна единица параметра соответствует 100 МГц частоты, если BCLK зафиксирована на сотне.

Для повседневного использования не стоит использовать ОЗУ с частотой выше DDR4-3600.

Функционал материнских плат пока не позволяет подобным образом разделять еще и рабочий вольтаж процессора. Но есть надежда, что в будущих поколениях эту возможность обязательно реализуют.

Методика разгона, мониторинг и проверка системы на стабильность

Как бы банально это ни звучало, но перед любым процессом оверклокинга стоит протестировать ПК в штатном режиме. Запустить несколько бенчмарков, промониторить текущую температуру и исправить выявленные баги (если таковые замечены).

В случае, если все в полном порядке, смело повышаем множитель процессора и вольтаж (в настройках BIOS рекомендуется использовать режим Adaptive voltage mode вместо Manual или Offset mode для параметра Vcore).

Далее ищем стабильную частоту и минимальное напряжение, при котором система ведет себя стабильно (прохождение POST, запуск ОС, работоспособность служебных приложений, стресс-тесты и т. д.). При этом не забываем фиксировать рабочую температуру ЦП, она не должна превышать 80 градусов даже в самых жарких условиях.

Как правило, комплекты с частотой DDR4-4000+ не требуют вольтажа выше 1,25 В для параметра System Agent.

После разгона ЦП переходим к оперативной памяти. Наиболее предпочтительным вариантом является активация параметра XMP (если модули и материнская плата этот профиль поддерживают). В противном случае придется искать максимальную рабочую частоту и тайминги самостоятельно.

Не исключено, что при выявлении стабильного значения ОЗУ потребуется корректировка параметров Vcore, System Agent (VCCSA) и VCCIO, об этом поговорим ниже.

Предпочтительные стресс-тесты:

Практика разгона и настройки в UEFI BIOS

Итак, перейдем к практической части, а именно к настройкам параметров в BIOS и самому разгону. Нам понадобится вкладка Extreme Tweaker на материнских платах ASUS.

что значит запуск игры без avx. Смотреть фото что значит запуск игры без avx. Смотреть картинку что значит запуск игры без avx. Картинка про что значит запуск игры без avx. Фото что значит запуск игры без avxчто значит запуск игры без avx. Смотреть фото что значит запуск игры без avx. Смотреть картинку что значит запуск игры без avx. Картинка про что значит запуск игры без avx. Фото что значит запуск игры без avx

Регулируем следующие опции:

Переходим в подменю Internal CPU Power Management:

Сохраняем настройки и перезагружаем систему, пробуем пройти POST и зайти в ОС. Если система стабильна, повышаем множитель до 49-50 пунктов, а к текущему вольтажу, при необходимости, подкидываем +0,02 В. Но стараемся не превышать критическую отметку в 1,35 В.

После этого проверяем систему на прочность в Prime95 и следим за температурой ЦП (она должна быть не выше 80 градусов).

Для ОЗУ в UEFI выбираем режим XMP. При поиске стабильной частоты памяти может потребовать регулировка опций CPU VCCIO и CPU System Agent в соответствии со следующими рекомендациями:

Впрочем в зависимости от используемого процессора и памяти приведенные показатели могут варьироваться. Как правило, комплекты с частотой DDR4-4000+ не требуют вольтажа выше 1,25 В для параметра System Agent.

Вновь проводим стресс-тесты с примененными параметрами. Не забываем про опцию AVX Core Ratio Negative Offset, которую рекомендуется зафиксировать на значении в 2 пункта (при тактовой частоте ЦП 4900 МГц, AVX приложения будут функционировать на 4700 МГц).

Заключение

Данные советы помогут добиться желаемого результата в деле разгона процессоров Intel Kaby Lake до 5 ГГц и выше; потенциал у камней внушительный.

Главное не пренебрегать качественным охлаждением и длительным прогоном стресс-тестов.

Страница 4: Intel Core i7-6950X | Обновленная поддержка разгона

Несколько недель назад Intel провела пресс-конференцию, на которой поделилась информацией об обновленной поддержке разгона. Здесь стоит упомянуть три ключевых момента:

Per Core Overclocking

До сих пор для многоядерных процессоров в BIOS можно было менять множитель двумя способами: указывать один множитель для всех ядер, либо опереться на технологию Intel Turbo, которая выставляет разные частоты для одного, двух или большего числа ядер. Таким образом, если в 4-ядерном процессоре нагружались не все ядра, то частота могла быть выше.

У процессора Core i7-6950X и остальных моделей линейки Broadwell-E Intel теперь позволяет более точно регулировать частоты каждого ядра отдельно. Например, ядро 0 может работать на фиксированной частоте 4.000 МГц, ядро 1 – на 4.200 МГц, а ядро 2 – на 4.400 МГц – и так далее. Если вы хотите исследовать потенциал разгона каждого ядра индивидуально, у вас теперь появилась такая возможность.

Мы протестировали функцию с нашим образцом и выставили разные тактовые частоты ядер в BIOS:

CPU-Z и другие утилиты показывают, как правило, тактовую частоту Core 0, но в пакете ASUS AI Suite 3 уже можно посмотреть частоты ядер CPU по-отдельности. Здесь отображаются значения, выставленные в BIOS. Результаты тестов тоже реагируют на увеличение/уменьшение частот.

Подобная технология открывает интересные возможности разгона. У нашей модели ядра 2, 3 и 4, например, нагревались сильнее, поэтому для них была выше вероятность потери стабильности работы системы. Такие ядра имеет смысл выставить на чуть меньшие тактовые частоты, а «холодные» ядра – на более высокие частоты.

AVX Ratio Offset

Иногда процессор теряет стабильность не из-за вычислительных ядер самих по себе, а из-за функциональных блоков. В частности, в прошлом блок AVX оказывался довольно проблемным. Intel теперь позволяет отдельно выставлять частоты не только кэша, но и блока AVX – через смещение от частоты ядер. Если выбрать настройку «1», то частота блока AVX будет на 100 МГц ниже частоты ядер.

В нашем случае мы не смогли получить больший уровень разгона, поиграв с данной настройкой.

VccU Voltage Control

Intel решила предоставить большую свободу регулировки напряжений для разгона. К предыдущим настройкам напряжения добавилась еще одна опция для более тонкой регулировки напряжений.

Результаты разгона

Как можно видеть на скриншоте, у нашего образца мы смогли разогнать ядра до частоты 4,3 ГГц. Некоторые ядра смогли работать быстрее, но из-за высокого тепловыделения CPU под полной нагрузкой мы упирались в пределы возможностей нашей системы охлаждения. Под Prime95 энергопотребление системы составило 350 Вт, так что CPU потреблял не меньше 250 Вт тепла. Такой уровень даже для нашей СВО Corsair H110GT весьма велик.

Оверклокер Dancop из команды Hardwareluxx смог получить дополнительные результаты под воздушным охлаждением, он не смог разогнать процессор сильнее. 10-ядерный Core i7-6950X удалось разогнать с 3,5 ГГц до 4,3 ГГц, то есть примерно на 800 МГц. Напомним, что разгон – дело удачи, как повезет.

Источник

Популярно об MMX, SSE и AVX

В мире компьютерных технологий нет ничего странного в обилии всевозможных аббревиатур: CPU, GPU, RAM, SSD, BIOS, CD-ROM, и многих других. И почти каждый день появляются всё новые и новые сокращения названий каких-то технологий, что является неизбежным следствием бесконечного стремления инженеров улучшить функции и возможности наших вычислительных устройств.

Сегодня речь пойдёт о таких расширениях набора команд процессоров, как MMX, SSE и AVX. Многим знакомы эти сокращения, и мы выясним, действительно ли это какие-то интересные разработки, или же это не более чем бессмысленные маркетинговые уловки.

Ну о-о-очень первые дни

Середина 80-х прошлого столетия. Рынок процессоров был очень похож на сегодняшний. Intel бесспорно преобладала, но столкнулась с жесткой конкуренцией со стороны AMD. Домашние компьютеры, такие как Commodore 64, использовали базовые 8-битные процессоры, тогда как настольные ПК начинали переходить с 16-битных на 32-битные чипы.

Эти числа означают размер значений данных, которые могут быть обработаны математически, при этом чем выше эти значения, тем выше точность и возможности. Они также определяет размер основных регистров в микросхеме: небольших участков памяти, используемых для хранения рабочих данных.

Такие процессоры являются также скалярными и целочисленными. Что это означает? Скаляр – это когда над одним элементом данных выполняется только одна любая математическая операция. Обычно это обозначается как SISD (single instruction, single data, «одиночный поток команд – одиночный поток данных»).

Таким образом, инструкция по сложению двух значений данных просто обрабатывается для этих двух чисел. А если вам, например, нужно прибавить одно и то же значение к группе из 16 чисел, то для этого потребуется выполнить все 16 наборов инструкций – для каждого числа из этой группы по отдельности. По-другому процессоры тех лет складывать ещё не умели.

что значит запуск игры без avx. Смотреть фото что значит запуск игры без avx. Смотреть картинку что значит запуск игры без avx. Картинка про что значит запуск игры без avx. Фото что значит запуск игры без avx
Intel 80386DX с частотой 16МГц (1985).

В те времена под инструкциями x86 понимали наборы команд для целочисленных (integer) операций, а под инструкциями x87 – для чисел с плавающей точкой (float). В наши дни все операции умеет выполнять один процессор, поэтому мы используем термин x86 для обозначения набора инструкций обоих типов данных.

Использование отдельных сопроцессоров для обработки разных типов данных было нормой, пока Intel не представила 80486: их первый CPU для персоналок со встроенным математическим сопроцессором для обработки вещественных данных (FPU, Floating Point Unit).

что значит запуск игры без avx. Смотреть фото что значит запуск игры без avx. Смотреть картинку что значит запуск игры без avx. Картинка про что значит запуск игры без avx. Фото что значит запуск игры без avx
Intel 80486: Жёлтым цветом выделен блок FPU для обработки чисел с плавающей точкой.

Как вы можете видеть, этот блок совсем немного занимает места в процессоре, но рывок в производительности, благодаря этому решению, был огромен.

Но в целом принцип работы оставался скалярным, и таким он перешел и к преемнику 486-го: оригинальному Intel Pentium.

И пройдёт ещё три года после релиза этого первого Пентиума, прежде чем Intel представит миру Pentium MMX. Это произошло в октябре 1996 года.

V – значит «векторный». А MMX что значит?

В мире математики числа можно группировать в наборы различных видов и размеров – одна такая упорядоченная совокупность называется арифметическим вектором. Проще всего представить его себе в виде списка значений, расположенных горизонтально или вертикально. Технология MMX привнесла в мир процессоров возможность выполнять векторные математические вычисления.

Однако она была изначально довольно ограниченной, поскольку оперировала только целыми числами и фактически эксплуатировала для своих целей регистры FPU. Поэтому программисты, желающие использовать какие-то инструкции MMX, вынуждены иметь в виду, что при выполнении таких инструкций любые вычисления с плавающей запятой не могут выполняться одновременно с ними.


Знаменитая реклама технологии Intel MMX (1997).

FPU Pentium имел 64-битные регистры, и в операциях MMX каждый из них мог вместить два 32-битных, четыре 16-битных или восемь 8-битных целых числа. Именно эти группы чисел и являются векторами, и каждая инструкция, предназначенная для них, будет выполняться сразу над всеми значениями в группе.

Такой принцип получил название SIMD (single instruction, multiple data, «одиночный поток команд, множественный поток данных») и знаменует собой большой шаг вперед в развитии возможностей процессоров для персональных компьютеров.

Ну а какие приложения выигрывают от использования такого принципа? Практически все, которым приходится выполнять одинаковые вычисления над группой однородных данных, и в первую очередь это некоторые функции в 3D-моделировании и мультимедийных технологиях, а также в системах обработки стандартных сигналов.

Например, MMX можно применить для ускорения умножения матриц при обработке вершин в 3D, или для смешивания видеопотоков при работе с хромакеем или альфа-композитингом.

что значит запуск игры без avx. Смотреть фото что значит запуск игры без avx. Смотреть картинку что значит запуск игры без avx. Картинка про что значит запуск игры без avx. Фото что значит запуск игры без avx
Процессор AMD K6-2 – где-то там есть 3DNow!

К сожалению, внедрение MMX продвигалось довольно медленными темпами из-за негативного влияния этой технологии на производительность операций с плавающей точкой. AMD частично решила эту проблему, создав свою собственную версию под названием 3DNow! примерно через два года после появления MMX. Технология от AMD предлагала больше инструкций SIMD и умела обрабатывать числа с плавающей точкой, но также страдала от недостатка понимания программистами.

Ах, да! Как же официально расшифровывается аббревиатура MMX? Согласно Intel – никак!

Проще пареной SSE

Ситуация переломилась в лучшую сторону с приходом в 1999 году процессора Intel Pentium III. Он принёс с собой блестящую реализацию векторной функции под названием SSE (Streaming SIMD Extensions, «потоковые расширения SIMD»). На этот раз это был дополнительный набор из восьми 128-битных регистров, отдельных от регистров в FPU, и стек дополнительных инструкций для обработки чисел с плавающей точкой.

Использование независимых регистров означает, что больше нет такой сильной зависимости от FPU, хотя Pentium III не мог выполнять инструкции SSE одновременно с инструкциями FP. А также, новая функция поддерживает только один тип данных в регистрах: четыре 32-битных FP-числа.

Но переход к использованию FP-инструкций SIMD позволил значительно увеличить производительность в таких приложениях, как кодирование/декодирование видео, обработка изображений и звука, сжатие файлов и многих других.

что значит запуск игры без avx. Смотреть фото что значит запуск игры без avx. Смотреть картинку что значит запуск игры без avx. Картинка про что значит запуск игры без avx. Фото что значит запуск игры без avx
Pentium IV: желтым цветом выделен блок регистров SSE2.

Усовершенствованная версия SSE2 появилась в 2001 году вместе с Pentium 4, и на этот раз поддержка типов данных была намного лучше: четыре 32-битных или два 64-битных FP-числа, а также шестнадцать 8-битных, восемь 16-битных, четыре 32-битных или два 64-битных целых числа. Регистры MMX остались в процессоре, но все операции MMX и SSE могли выполняться с использованием независимых 128-битных регистров SSE.

Модификация SSE3 появилась на свет в 2003 году, имея больше инструкций и возможность выполнять некоторые математические вычисления между значениями внутри одного регистра.

Ещё через 3 года мы познакомились с архитектурой Intel Core, принёсшей ещё одну ревизию технологии SIMD (SSSE3 – Supplemental SSE, «расширенные SSE»), и чуть позже в том же году – финальную версию, SSE4.

что значит запуск игры без avx. Смотреть фото что значит запуск игры без avx. Смотреть картинку что значит запуск игры без avx. Картинка про что значит запуск игры без avx. Фото что значит запуск игры без avx

В 2007 году AMD применила собственную версию расширений CPU-инструкций SSE4 в своей архитектуре Barcelona. С названием в AMD париться не стали, и назвали свою версию просто SSE4a.

С линейкой Nehalem Core в 2008 году было выпущено незначительное обновление этой версии, которую Intel обозначила как SSE4.2 (а под SSE4.1 стали понимать исходную версию этого обновления). Обновления не затронули регистры, а лишь добавили больше инструкций в таблицу, расширив диапазон возможных математических и логических операций.

AMD, со своей стороны, сперва предложила новую версию SSE5, но позже решила разделить ее на три отдельных расширения, одно из которых довольно проблемное – подробнее об этом чуть позже.

К концу 2008 года и Intel, и AMD поставляли процессоры, которые уже могли обрабатывать все версии наборов инструкций от MMX до SSE4.2, и многие приложения (в основном игры) начали требовать этих функций для работы.

Время для новых букв

2008 год также был годом, когда Intel объявила о том, что они работают над значительным апгрейдом своей системы SIMD, и в 2011 году выкатила линейку процессоров Sandy Bridge с поддержкой набора инструкций AVX (Advanced Vector Extensions, «продвинутые векторные расширения»).

Всё удвоилось: вдвое больше векторных регистров и вдвое больше их размер.

Шестнадцать 256-битных регистров вмещают только восемь 32-битных или четыре 64-битных вещественных числа, поэтому в плане форматов данных, этот набор инструкций более ограничен в сравнении с SSE, но ведь и SSE никто не отменял. К тому времени программная поддержка векторных операций для CPU была уже хорошо отлажена, начиная с фундаментального мира компиляторов, заканчивая сложными приложениями.

что значит запуск игры без avx. Смотреть фото что значит запуск игры без avx. Смотреть картинку что значит запуск игры без avx. Картинка про что значит запуск игры без avx. Фото что значит запуск игры без avx

И не даром: Core i7-2600K (или подобный ему), работающий на частоте 3,8ГГц, потенциально может выдавать более 230 GFLOPS (миллиардов операций с плавающей точкой в секунду) при выполнении инструкций AVX – неплохо для дополнения, относительно немного места занимающего на кристалле процессора.

Или могло бы быть неплохо, если бы он действительно работал на частоте 3,8ГГц. Частично проблема AVX заключалась в том, что нагрузка на чип получалась настолько высокой, что Intel пришлось заставить процессор автоматически снижать тактовую частоту в этом режиме примерно на 20%, чтобы уменьшить энергопотребление и не допустить перегрева. К сожалению, такова цена за выполнение любой работы SIMD в современном процессоре.

Еще одно усовершенствование, предлагаемое в AVX – это возможность работать одновременно с тремя значениями. Во всех версиях SSE операции выполнялись между двумя значениями, после чего результат заменял одно из них в регистре. При выполнении инструкций SIMD AVX не трогает исходные значения, сохраняя результирующее значение в отдельный регистр.

что значит запуск игры без avx. Смотреть фото что значит запуск игры без avx. Смотреть картинку что значит запуск игры без avx. Картинка про что значит запуск игры без avx. Фото что значит запуск игры без avx

AVX2 был выпущен вместе с архитектурой Haswell для процессоров Core 4-го поколения в 2013 году, и представлял собой довольно значительный апгрейд, благодаря добавлению нового расширения: FMA (Fused Multiply-Add, «умножение-сложение с однократным округлением»).

Эта независимая функция в составе AVX2 была крайне востребована для приложений, работающих с векторной и матричной математикой, поскольку давала возможность выполнять две операции с помощью одной инструкции. Функция поддерживала и скалярные операции также.

Проблема оказалась в том, что FMA от Intel отличался от аналогичного расширения AMD настолько, что они были совершенно несовместимы. Причина в том, что Intel FMA представляет собой систему с тремя операндами, то есть работает с тремя отдельными значениями: два слагаемых и сумма, либо три слагаемых и сумма, замещающая одно из слагаемых.

У версии от AMD четыре операнда, поэтому она может вычислить 3 числа и записать ответ в отдельный регистр, не трогая исходные значения. Математически FMA4 лучше, чем FMA3, но его реализация немного сложнее, как с точки зрения программирования, так и с точки зрения интеграции функции в процессор.

AVX-512: а не многовато-ли?

AVX2 ещё только начал появляться на рынке процессоров, а Intel уже плела маниакальные планы относительно его преемника, AVX-512, и общий настрой среди разработчиков был такой: «больше регистров богу регистров!». Мало того, что этих самых регистров снова вдвое больше, и они снова вдвое увеличились в размере, так ещё и появился стек новых инструкций и поддержка устаревших.

Первой партией чипов, на которых поднялся в воздух набор функций AVX-512, стала серия Xeon Phi 7200 – второе поколение громоздких и очень многоядерных процессоров Intel, ориентированных на рынок суперкомпьютеров.

что значит запуск игры без avx. Смотреть фото что значит запуск игры без avx. Смотреть картинку что значит запуск игры без avx. Картинка про что значит запуск игры без avx. Фото что значит запуск игры без avx

72-ядерный 288-потоковый Knights Landing Xeon Phi.

В отличие от всех предыдущих реализаций, новый набор векторных инструкций состоял из 19-и компонентов: базового – AVX-512F, – необходимого для обеспечения совместимости, и множества весьма специфических. Эти дополнительные наборы охватывают такие области операций, как обратная математика, целочисленные FMA и алгоритмы свёрточной (конволюционной) нейронной сети (CNN-алгоритмы).

Первоначально AVX-512 был только прерогативой крупнейших чипов Intel, предназначенных для рабочих станций и серверов, но теперь их недавние архитектуры Ice Lake и Tiger Lake также поддерживают его. Да, не удивляйтесь: вы можете купить легкий ноутбук с процессором, имеющим 512-битные векторные блоки.

Это может показаться круто. А может и не показаться – в зависимости от вашей точки зрения. Регистры на кристалле CPU обычно группируются в так называемом регистровом файле, как видно на макрофото ниже.

что значит запуск игры без avx. Смотреть фото что значит запуск игры без avx. Смотреть картинку что значит запуск игры без avx. Картинка про что значит запуск игры без avx. Фото что значит запуск игры без avx 2-ядерный Intel Skylake

Желтым прямоугольником выделен файл векторных регистров, красный прямоугольник – это наиболее вероятное расположение файла целочисленного регистра. Обратите внимание, насколько файл векторного регистра больше integer-регистра. В Skylake используются 256-битные регистры AVX2, следовательно аналогичный векторный регистровый файл AVX-512 занял бы на таком же кристалле в четыре раза больше места: вдвое больше, потому что вдвое больше их размер, и ещё вдвое – потому что самих регистров вдвое больше.

А очень-ли нужно такое количество векторных регистров маленькому чипу, который должен быть максимально мобильным? Хоть речь и не о лишних килограммах в ноутбуке, а лишь о небольшой части площади ядра процессора, каждый квадратный миллиметр имеет значение, когда речь идет о миниатюризации мобильных устройств и наиболее эффективном использовании доступного пространства в них.

И учитывая, что использование AVX в любом виде приводит к автоматическому уменьшению тактовой частоты, использование AVX-512 на таких платформах скорее всего приведет к ещё более сомнительным издержкам по сравнению с любым из своих предшественников, поскольку при работе он потребляет еще больше энергии.

что значит запуск игры без avx. Смотреть фото что значит запуск игры без avx. Смотреть картинку что значит запуск игры без avx. Картинка про что значит запуск игры без avx. Фото что значит запуск игры без avx

И проблема AVX-512 не только в применении к небольшим мобильным процессорам. Разработчикам, пишущим код для работы на рабочих станциях и серверах, и для которых увеличение возможностей векторных расширений действительно важный вопрос, потребуется создавать несколько версий кода. Это связано с тем, что не все процессоры с AVX-512 работают с одинаковым набором команд.

Например, набор IFMA (Integer Fused Multiply Add, «целочисленное умножение-сложение с однократным округлением») доступен только на процессорах Cannon, Ice и Tiger Lake. В то время как процессоры на архитектуре Cooper и Cascade Lake его не поддерживают, несмотря на то, что они относятся к сегменту процессоров для серверов и рабочих станций.

Стоит отметить, что AMD не предлагает поддержку AVX-512, и не собирается. По их мнению, обработка массивных векторных вычислений – это прерогатива GPU. С AMD полностью солидарна Nvidia, и обе компании уже выпустили продукты специально для таких нужд.

И дальше что?

Много лет назад процессор с возможностью обработки векторной математики ознаменовал собой эпохальный прорыв. Современные процессоры обладают огромными возможностями, предлагая множество наборов инструкций для обработки целочисленных операций и операций с плавающей запятой для скалярных, векторных и матричных данных.

Что касается последних двух типов данных, то CPU теперь напрямую конкурируют с GPU: ведь мир 3D-графики – это как раз всё, что связано с SIMD, векторами, плавающими точками и т.д. И производители GPU не спали – разработка графических ускорителей велась стремительными темпами. В начале 2010-х годов купить видеокарту, процессор которой способен выполнять почти 800 миллиардов инструкций SIMD в секунду, вы уже могли менее чем за 500 долларов.

Это больше, чем то, на что сейчас способны лучшие из десктопных CPU. Но они и не предназначены для рекордов в какой-то конкретной области – их задача обрабатывать очень обобщенный код, который зачастую не повторяется или легко распараллеливается. Поэтому, не стоит думать, что возможности SIMD столь жизненно-важны для CPU, скорее это полезное дополнение к его арсеналу.

что значит запуск игры без avx. Смотреть фото что значит запуск игры без avx. Смотреть картинку что значит запуск игры без avx. Картинка про что значит запуск игры без avx. Фото что значит запуск игры без avx Вас интересует производительность SIMD в чистом виде? Ваш выбор – видеокарта, а не материнка!

Стремительное развитие графических процессоров недвусмысленно намекает, что для CPU нет нужды иметь чересчур большие векторные блоки, и почти наверняка именно поэтому AMD даже не пыталась разрабатывать своего собственного преемника для AVX2 (расширение, которое они используют в своих чипах с 2015 года). Давайте также не будем забывать, что процессоры следующего поколения могут больше походить на мобильные однокристальные (SoC, System-on-a-Chip), где под каждый тип задач выделена площадь на кристалле. Intel, в свою очередь, похоже, стремится внедрить AVX-512 в как можно большее количество продуктов.

Ждёт ли нас ещё и AVX-1024? Вряд ли, либо очень нескоро. Скорее всего, Intel займётся расширением AVX-512 с помощью дополнительных компонентов с инструкциями, чтобы повысить гибкость, а чистую SIMD-производительность переложит на плечи своей недавно разработанной линейки графических процессоров Xe.

что значит запуск игры без avx. Смотреть фото что значит запуск игры без avx. Смотреть картинку что значит запуск игры без avx. Картинка про что значит запуск игры без avx. Фото что значит запуск игры без avx

Библиотеки SSE и AVX теперь являются неотъемлемой частью программного обеспечения: Adobe Photoshop требует, чтобы процессоры поддерживали как минимум SSE4.2; API машинного обучения TensorFlow требует поддержки AVX; Microsoft Teams может выполнять фоновые видеоэффекты, только если доступен AVX2.

Это говорит только об одном: несмотря на то, что в плане обработки SIMD графическим процессорам нет равных, этот функционал ещё долго будет в арсенале CPU. Так что будем ждать нового поколения векторных расширений и надеюсь, реклама нас впечатлит.

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *