Что дает SLI режим

Что дает SLI режим

Зачем нужны видеокарты с поддержкой SLI?

SLI — это запатентованная технология параллельной обработки, разработанная Nvidia. Позволяет нескольким графическим процессорам соединяться и работать на одном ПК через мост SLI для быстрой передачи данных между двумя устройствами.

Аббревиатура расшифровывается как Scalable Link Interface, а идея масштабируемости лежит в основе технологии нескольких графических процессоров. Чтобы добиться этого, несколько графических процессоров могут одновременно воспроизводить кадры для вывода на один дисплей, что теоретически значительно расширяет возможности графической обработки машины.

В 1998 году 3Dfx произвела и распространила линейку графических ускорителей, известную как Voodoo2. Это первое устройство, использующее недавно представленный интерфейс 3dfx Scan-Line Interface, или SLI, и включающее три графических процессора на одной карте. Voodoo2 была первой ориентированной на потребителя видеокартой. Во многом задала тон богатому, динамичному аппаратному рынку в настоящее время для игровой индустрии.

Связь между двумя картами Voodoo2 обеспечивалась ленточным кабелем, который позволял картам обмениваться данными и отображать изображение, чередуя рисование горизонтальных линий пикселей. Эта технология позволила использовать разрешение 1024 × 768, что считается значительным скачком по сравнению с конкурентами с одной картой, которые могли управлять только стандартными 800 × 600.

На фоне агрессивного маркетингового продвижения технология SLI обещала удвоить вычислительную мощность ПК. В действительности, технология столкнулась со многими проблемами, в основном связанными с необходимостью жертвовать слотами PCI Express для размещения двух устройств Voodoo2 за счет сетевых карт и тому подобного.

Фактический процесс рендеринга был подвержен неприглядным артефактам отображения, таким как неполные кадры и разрывы. Запретительные затраты на приобретение двух карт (около 300 долларов каждая) оказались препятствием для широкого распространения этой технологии, и это оставалось прерогативой нишевых энтузиастов, жаждущих похвастаться своей игровой системой.

Но судьба 3Dfx быстро пошла на юг из-за грязного слияния с STB Systems, замедления продаж и неспособности идти в ногу с экспоненциально лучшими линейками карт GeForce и Radeon . В конце 2000 года Nvidia приобрела компанию-производителя графических карт, производство и поддержка которой вскоре прекратились.

Nvidia не сразу использовала технологию SLI, и она оставалась бездействующей до 2004 года. Компания повторно запустила его как Scalable Link Interface, ориентированный на использование в слотах PCI-e, а не в ранее использовавшихся слотах PCI.

Технология стала повсеместно распространенной в большинстве современных графических процессоров Nvidia, и большинство стандартных технологий чипсетов для материнских плат, особенно серии Intel X и Z, поддерживают SLI.

Большая часть аппаратной технологии была заменена и обновлена ​​для современных потребностей, но основная концепция использования мощности двух параллельных графических процессоров остается.

Особенности технологии

SLI работает на устройствах подключенные в общую сеть видеокарт, где одна карта выступает в качестве конечного порта вызова или главного устройства, отвечающего за отправку на дисплей окончательно прорисованной трехмерной графики. Эта технология может одновременно соединять 2, 3 и 4 графических процессора, стилизованные под 2-way, 3-way и 4-Way SLI .

Мост SLI обеспечивает передачу данных и отношения «ведущий-ведомый» между двумя идентичными графическими процессорами. Идея состоит в том, чтобы обойти чипсет материнской платы в целом и позволить устройствам обмениваться данными напрямую, избегая, таким образом, конкуренции за ограниченную пропускную способность.

Существует четыре типа мостов:

  • Стандартный мост SLI с полосой пропускания до 1 ГБ в секунду и тактовой частотой 400 МГц.
  • Светодиодный мост SLI , который похож на ранее упомянутый стандартный мост, за исключением пикселей с тактовой частотой 540 МГц и способности излучать светодиодное освещение RGB во время работы.
  • Мост SLI HB или мост с высокой пропускной способностью, работающий на частоте 650 МГц со скоростью передачи около 2 ГБ в секунду. В настоящее время это самый распространенный мост.
  • Мост NVLink считаетсяя самым последним форматом и уникальным для линейки графических процессоров Nvidia RTX. Отличается скоростью до 100 ГБ в секунду.

Различные скорости передачи означают, что каждый тип подходит для определенного разрешения. Мост SLI лучше работает при 1080p, светодиод SLI — при 4K, а SLI HB и NVLink подходят для 5K.

Работа SLI — сводится к разделению задач рендеринга в равной степени между графическими процессорами. В большинстве случаев одна карта будет концентрироваться на наборе кадров, а другая — на другой половине. В совокупности создается полностью сформированный кадр, готовый для отображения на мониторе.

В настоящее время существует три режима SLI:

  • Рендеринг с разделением кадров , при котором нагрузка рендеринга распределяется по горизонтали на куски в зависимости от сложности 3D и делится на графические процессоры.
  • Альтернативный рендеринг кадров , при котором каждый графический процессор последовательно выводит кадр. GPU 1 отображает кадр 1, GPU 2 отображает кадр 2, GPU 1 отображает кадр 3, GPU 2 отображает кадр 4 и т.д. До бесконечности. Результатом считается более высокая частота кадров.
  • Сглаживание SLI , благодаря чему возможности сглаживания увеличиваются в два раза благодаря совместному распределению задачи обработки между графическими процессорами в схеме смещения. Результатом считается поразительно лучшее визуальное качество, но в результате производительность имеет тенденцию принимать удар. Возможно сталкивались с этой опцией в настройках игр, часто сопровождаемых SLI 8X или SLI 16X, и задавались вопросом, что все это значит?

Чтобы SLI работал, разработчики должны кодировать игры для поддержки этой технологии. Из-за сложности, присущей двум графическим процессорам для совместной работы, этот процесс требует значительных усилий.

После того, как они установили солидный набор настроек, которые не нарушают игру, Nvidia публикует так называемый профиль SLI. Он содержит набор обновлений драйверов, предназначенных для подготовки графического процессора к работе с игрой и повышения графической производительности.

Актуальность и критика

Поддержка SLI снижается со времен безмятежности графических процессоров Nvidia серии GTX 600, 700, 900. В те годы большинство игр стремились поддерживать SLI, и как Nvidia, так и разработчики заметили толчок к интеграции этой технологии. Со стороны потребителей был высокий интерес, и SLI оказался доступным способом более или менее удвоить графические возможности системы.

Однако с появлением все более мощных одиночных графических процессоров, особенно серий 1000 и 2000, более чем способных удовлетворить требования «ультра» настроек в современных играх. Потребность в установке с двумя графическими процессорами приближается к моральному устареванию для среднего уровня.

Небольшое меньшинство игроков используют SLI, означает, что создание профиля ограничено все меньшим количеством новых игр. Разработчики сосредотачивают свои ресурсы на игровых функциях, исправлениях ошибок и изменениях, которые затрагивают большую часть игроков с одним GPU. Производители не кодируют их игры для поддержки SLI, и не ломаются, для нишевой группы пуристов, стремящихся достичь лучший FPS и разрешение на 5K или выше.

Отсутствие потребителей, покупающих установки с двумя графическими процессорами, означает что разработчики реже обращают внимание на поддержку SLI. Теперь меньше людей покупают машины с SLI.

Для игр, которые поддерживают SLI, масштабирование часто не достигает 200%, ожидаемого от двух идентичных графических процессоров. Технология SLI склонна к микропроцессорам (особенно в режиме рендеринга альтернативных кадров) и другим проблемам с производительностью, отсутствующим при рендеринге с одним графическим процессором. Это отталкивает многих потребителей, интересующихся технологией SLI.

Многие новые и старые игры не будут работать с включенным SLI, это означает что его нужно отключить, чтобы играть. Ценовое соображение вновь поднимает голову, и многие не видят логики в двойной трате за столь малую прибыль. Требования к мощности установки SLI учитывают эту тенденцию.

Nvidia постепенно отказывается от поддержки SLI, поскольку она выпускает новые модели, что считается лучшим признаком того, что технология находится в упадке. Из самой последней серии RTX только RTX 2080 и RTX 2080 TI поддерживают NVLink, необходимый для графических процессоров с двумя SLI . Вероятность того, что кто-либо, кроме опытных пользователей, будет использовать эту технологию за высокую цену на эти модели маловероятна.

Чтобы больше повлиять на состояние SLI, DirectX 12 в настоящее время не поддерживает SLI. Все больше разработчиков переходят на новую и универсальную версию популярного API. Вероятно названия с поддержкой SLI резко упадут.

Преданные SLI утверждают иначе. Тысячи долларов были вложены в топовую серию двойных графических процессоров. Эта группа стремится оправдать свои вложения дерзкой и сердечной дозой когнитивного диссонанса.

Если SLI зацепил вас, обратите внимание на текущее состояние поддержки SLI для большинства игр. Если есть финансы для поддержки такой настройки и имеется видеокарта с хорошим FPS и более высокого разрешения, то SLI это лучший выбор.

Краткое исследование влияния SLI на процессорозависимость

Некоторые читатели (в особенности — любители игр) нередко высказывают к нашей методике тестирования процессоров замечания вида: «Нечего тестировать 3D-приложения со слабой видеокартой, поскольку в этом случае всё именно в нее и упирается». Несколько более редкое, но тоже регулярно встречающееся замечание касается фиксации на длительный срок всех версий ПО, включая и видеодрайверы — дескать, они обновляются и дорабатываются постоянно, поэтому полученные на старых версиях результаты не соответствуют действительности.

Справедливы ли эти замечания? Отчасти да. Действительно — и видеокарта существенно влияет на многие результаты, и при использовании разных версий драйверов производительность меняется. Однако так ли это важно? Ведь, по большому счету, производительность в играх действительно зависит в первую очередь от видеокарты. Тем более, что на момент запуска любой версии методики в эксплуатацию, мы берем одну из моделей верхнего уровня. К примеру, сейчас используется ускоритель GeForce GTX 570, быстрее которого из одночиповых решений в прошлом году был разве что GTX 580. За прошедшее время положение дел на рынке изменилось, однако более быстрых GPU до сих пор очень немного, и занимают они на рынке, мягко говоря, не доминирующее положение. Т. е. у большинства пользователей в наличии есть лишь более медленные карты, так что для них разница в игровой производительности различных процессоров еще меньше, чем получается в наших тестах.

Да и вопрос оптимизации драйверов очень скользкий. Действительно — новые версии часто исправляют различные ошибки, из-за чего новые игры (подчеркнем: именно новые; или, как минимум, существенно обновленные апдейтами) начинают работать быстрее. Но ведь и игровые тесты мы тоже фиксируем на аналогичный срок, так что сложно ожидать, что через несколько месяцев кто-то сильно улучшит положение дел в уже относительно старых проектах. Зато у нашего подхода есть свои достоинства, выливающиеся в столь популярные итоговые материалы: взять и протестировать за разумный промежуток времени несколько десятков конфигураций в таком количестве программ со свежайшими драйверами невозможно (за время тестирования и программы, и драйверы успеют обновиться), а вот постепенное накопление результатов — процесс не такой уж сложный.

Однако и нас нередко посещала крамольная мысль: «А так ли все гладко, как кажется в теории?». Вдруг, действительно, при более мощной видеоподсистеме удастся «нащупать» между топовыми процессорами бо́льшую разницу, чем смешные проценты и доли процента, получающиеся в основной серии тестирований? Или вдруг новые версии драйверов кардинально меняют расстановку сил? Вот первым вопросом мы и решили заняться, попутно затронув и второй :) Действительно — а как можно увеличить производительность видео? Варианта два: либо более мощный одиночный чип (но их не так много), либо multi-GPU. Найдя в закромах еще одну карту на GTX 570, идентичную используемой регулярно, мы остановились на втором пути. Пришлось заодно сменить и материнскую плату, поскольку для LGA1155 мы обычно используем модель на чипсете Н67, который multi-GPU не поддерживает. Но вдобавок, как оказалось, нужно и драйвер поменять: со старым массив SLI на Z77 отказывался активироваться. Кроме того, всплыл и еще один любопытный вопрос: а как производительность мультичипа зависит от шины? На платформе LGA1155 в этом случае используется конфигурация х8+х8, но ведь у нас есть еще и LGA2011, где доступны х16+х16. Конечно, последнее тестирование было бы интереснее проводить на продуктах AMD, поскольку CrossFireX поддерживает работу «чисто» по шине, а SLI требует мостиков (т. е. обмен данными между видеокартами идет в обход PCIe), однако мы решили, что для начала и это неплохо :)

Конфигурация тестовых стендов

Нами было взято четыре уже хорошо знакомых процессора, один из которых (Core i5-3570K) в ближайшее время станет верхушкой массового сегмента, один (Core i7-3960X Extreme Edition) — так и останется топовым решением, ну а еще два (Core i7-2700K и Core i7-3820) расположены между ними, примерно эквивалентны друг другу, но предназначены для двух разных платформ. Добавлять к списку что-либо бюджетное мы сочли излишним — покупатели различных Core i3, как правило, не только о multi-GPU не задумываются, но и одиночную видеокарту выбирают из более дешевого сегмента, нежели тот, в котором «живет» GTX 570.

Методика тестирования

Для изучения игровой производительности этих 12 (4 процессора × 3 конфигурации) испытуемых мы воспользовались соответствующим разделом нашей общей методики тестирования процессоров, т. е. шестью игровыми приложениями в режиме высокого качества и с разрешением 1680×1050.

Каждый процессор тестировался «в трех ракурсах». Во-первых, брались результаты из «базовой» линейки, полученные на драйвере версии 270.61 (Base). Во-вторых, аналогичная конфигурация, но на другой плате и с драйвером 296.10, последним на момент тестирования (Single). В-третьих, то же самое в плане софта и платы, но уже с двумя видеокартами (SLI).

Aliens vs. Predator

Игра весьма требовательна к видео, так что близкий к двукратному прирост в SLI-конфигурации был предопределен заранее. И какая-никакая польза от х16+х16 тоже наблюдается. Во всяком случае, при использовании Core i7-3820. А экстремальный 3960Х свою полную неадекватность для игрового компьютера с блеском продемонстрировал в первый, но не последний раз за сегодня. Толку от обновления драйвера, как видим, тоже нет никакого. Впрочем, в случае LGA1155 (где обнаружилось падение аж на 5%) все можно списать и на смену материнской платы. Хотя и это тоже, кстати, не укладывается в наивную концепцию «круче — значит лучше»: более высокой частота кадров оказалась на скромной плате на Н67, а вовсе не на экстремальной и более новой модели на топовом Z77. Но в целом на такую разницу можно не обращать внимания — как видим, никакого существенного изменения относительного положения различных процессоров нет ни при смене драйвера, ни при переходе от одной видеокарты к двум. Сам по себе последний режим очень полезен, но это тоже было заранее очевидно :)

Batman: Arkham Asylum GOTY Edition

А вот в этой игре на относительно старом движке от процессора зависит многое, и разница между процессорами при увеличении мощности видео возрастает. С одной стороны, можно порадоваться, с другой — очевидно, что на практике в подобных приложениях не только за мощным процессором гоняться не стоит, но и SLI для них городить тоже. Одиночный Core i5 (пусть и топовый в этой линейке, и новый) с одиночной же видеокартой уже выдал 245 кадров в секунду. Топовый Core i7 (который стоит более чем в четыре раза дороже) с двумя видеокартами (что, соответственно, удваивает цену видео) — 357. Блеск и нищета в чистом виде :) Поскольку прирост, конечно, заметный, но если рассуждать здраво, то и первого до… ээээ… достаточно. И даже избыточно :)

Crysis: Warhead x64

Когда-то системными требованиями Crysis пугали малолетних геймеров, ныне же, как видим, ничего страшного эта игра собой уже не представляет. И прирост частоты кадров в SLI-режиме относительно прироста в AvP (или, там, в Metro 2033, о котором чуть позже) не столь уж велик. Но он есть. А самым быстрым номинально процессором во всех трех случаях оказался Core i7-2700K, однако лишь номинально, поскольку правильнее считать всех равными.

Один из немногих случаев, когда новый драйвер явно обеспечил стабильный (пусть и не слишком большой прирост). И, обратите внимание: больше всего он «помог» новому же процессору. Т. е. имеем подтверждение сказанного в начале: чем больше в программно-аппаратной конфигурации нового, тем больше пользы от обновления драйверов. А с точки зрения житейского смысла опять правильнее считать, что все процессоры равны. И платформы тоже. Разница — только в видео.

Однако если перейти от относительно новых игр к старой… От новых драйверов тут — только минус (справедливости ради — как обычно, небольшой). От SLI — и вовсе сплошное расстройство: одной видеокарты на GTX 570 более чем достаточно, так что multi-GPU лишь все портит, давая «паразитную» нагрузку на процессор.

Metro 2033

Эта игра чем-то похожа на AvP, только предъявляет еще более высокие требования к компьютеру. В общем, опять наблюдаем высокую эффективность SLI — порядка 80%. А вот на все остальные факторы можно просто махнуть рукой.

На этом наш сегодняшний сеанс разрушения мифов можно считать завершившимся. Разумеется, игры бывают разными, а мы тестировали только шесть из них. С другой стороны, примерно одинаковое положение во всех шести позволяет с высокой долей уверенности утверждать, что и в других картина вряд ли будет сильно отличаться. Так какой будет итоговая оценка?

Миф о радикальном влиянии версии драйверов можно считать опровергнутым. Влияние, безусловно, есть. Но где-то так плюс-минус 5%. Причем и никакой однородности тоже не наблюдается — где-то может быть прирост, где-то падение. Во всяком случае, это верно для нашей ситуации — если вы вдруг купите новую видеокарту и/или начнете использовать новые игры (или существенные апдейты к установленным), то пренебрегать новыми драйверами, естественно, не стоит. Но исправление ошибок и улучшение совместимости, по-видимому, процесс не бесконечный — для старых продуктов с определенного момента заметные изменения происходить перестают. А несколько процентов в ту или иную сторону могут волновать, естественно, только тестеров.

Миф о неограниченной процессорозависимости видеокарт, растущей по мере роста мощности последних, тоже можно считать опровергнутым как минимум в рамках, в которые укладываются протестированные процессоры. Т. е. в сегменте до 200 долларов, который мы не затрагивали, возможно всякое. Но выше — любого процессора уже достаточно не только для одиночной GTX 570, но и для пары таких карт в тандеме. Тем более его достаточно для менее мощных конфигураций. Попытки снизить качество тоже ни к чему не приведут: да, конечно, где-то можно будет «нашарить» заметную разницу в относительном исчислении — но уже за гранью сотни-другой кадров в секунду. Повторимся, распространять эти результаты на более низкие сегменты не следует — вот там мощности уже может не хватить, тем более что расходуется она не только на работу видеосистемы. Но любого пристойного четырехъядерного процессора достаточно будет в подавляющем большинстве случаев. Так что покупать что-либо дороже 200 долларов для игр не стоит. Разве что для других задач.

Миф о радикальной разнице между платформами в плане поддержки конфигураций PCIe тоже можно считать опровергнутым в рамках тестирования. К вящему ужасу тех, кто выбирал платы под LGA1155 со всякими дополнительными коммутаторами — можно было и не городить огород :) Владельцам систем с LGA2011, все же, будет не так обидно: там большое количество линий PCIe — врожденная особенность «статусной» платформы. Но еще раз повторимся, такая картина верна для SLI, особых вольностей не позволяющего. Возьми мы CrossFireX с его гибкостью (нет требования в обязательном порядке использовать мостики и разрешены «перекошенные» конфигурации, типа х16+х4) — может быть, какие-нибудь различия и обнаружились бы.

Миф о том, что важнейшим компонентом компьютера является видео… А это, собственно, и не миф, что было очевидно изначально :) Просто мы в очередной раз подтвердили данный постулат. Из любого правила есть исключения, которым сегодня оказался Far Cry 2, где прироста производительности от SLI нет, но в существовании исключений никто и не сомневался. При этом показательно, что иногда производительность увеличивается и там, где она уже… не нужна. Вот выросла частота кадров в Batman — вроде бы, ну и что? Ведь и одиночная карта давала более чем достаточные 250 кадров в секунду. Но выросла ведь! А прирост в AvP и Metro вообще сложно переоценить. Причем, заметим, у нас методика все-таки ориентирована на тестирование процессоров. А ведь можно было настройки сделать более жесткими как раз для видео, да и 1680×1050 — не такое уж высокое разрешение с точки зрения современности. В этом случае полезность SLI или более мощной одиночной видеокарты была бы выражена еще сильнее.

В общем, вердикт простой и не раз озвученный: если вам нужен мощный игровой компьютер, то в первую очередь бюджет должен распределяться в пользу видеосистемы. Лучше купить Core i5 и пару GTX 570 (или даже 580/680), чем Core i7 Extreme и одну такую карту — первое и работать будет быстрее, и обойдется дешевле. А прочие факторы тоже, конечно, игнорировать не стоит, но лишь с точки зрения принципа, что в компьютере (как и в человеке) всё должно быть прекрасно :) И действуя так, лучше, во избежание разочарований, ни на какой эффект, кроме эстетического, заранее не рассчитывать.

Сравнение производительности видеокарт в SLI и CrossFire (mGPU) под DirectX 11 и DirectX 12

Эта статья была задумана как дань старой традиции: нам хотелось полюбоваться дорогими системами с несколькими GPU, как это было в 2014 и 2016 годах, а потом мы готовились с разочарованием признать, что технологии SLI и CrossFire уже утратили всякую практическую ценность. Но вместо этого получилось своего рода продолжение наших недавних публикаций про API нового поколения (см. первую и вторую части исследования), ведь большинство игр из нашей тестовой методики поддерживают Direct3D 12. Под этим API пара видеокарт работают совсем по-иному, нежели в Direct3D 11, и нет никакого смысла ограничиваться сравнением под формально устаревшим, но все еще преобладающим интерфейсом Direct3D 11.

А что касается главного вопроса (осталась ли какая-то польза в SLI и CrossFire), то придется признать, что похороны двухадаптерных систем снова откладываются! Да, в связи со сменой API возникли новые проблемы, связанные и c реализаций Multi-Adapter в Direct3D 12, и с пропускной способностью шины PCI Express, и с пресловутой процессорозависимостью игр. Но, с другой стороны, именно Direct3D 12 несет в себе возможности для того, чтобы их преодолеть.

⇡#Мультиадаптерный рендеринг в Direct3D 11

Для начала признаем намеренную неточность в названии статьи, которую могли заметить читатели, следящие за состоянием дел в области игровой графики. Действительно, марка CrossFire ушла в отставку еще в прошлом году. Теперь AMD описывает мультиадаптерные системы термином mGPU, поскольку сфера использования CrossFire (как и NVIDIA SLI) ограничена Direct3D 11, а кто, как не AMD, больше всех приветствует переход к Direct3D 12. Тем не менее сама технология никуда не делась, и даже в настройках драйвера Radeon по-прежнему называется именно так.

В целом оба производителя дискретных GPU сейчас прохладно относятся к мультиадаптерному рендерингу. Это заметно по тому, как сократилось разнообразие конфигураций, в которых работают SLI и CrossFire. Пропали видеокарты на основе двух графических процессоров, без которых прежде не обходилось ни одно обновление архитектуры. Драйверы AMD и NVDIA официально поддерживают не больше двух GPU. А ведь в 2011 году мы тестировали связки из трех и четырех видеокарт класса GeForce GTX 580, и в то время игры могли вполне неплохо загрузить три ускорителя высшего эшелона. К тому же NVIDIA загнала SLI в самый верх своей продуктовой линейки: младшей видеокартой в серии GeForce 10, которая имеет разъемы SLI, является сравнительно мощный и дорогой ускоритель GeForce GTX 1070.

Конечно, именно мощные видеокарты, как правило, и устанавливают парами, а утраченная возможность использовать три или четыре графических процессора по большей части была полезна только для набора рекордных баллов в 3DMark. Но потеря интереса к SLI и CrossFire со стороны хозяев рынка видеокарт отражает общий застой этого направления, к которому привело несоответствие между сложностью технических задач и низким спросом со стороны рядовых геймеров.

В концептуальном плане рендеринг при помощи множественных GPU — это вполне очевидная идея, которая логически следует из высокого параллелизма вычислений, но на практике такие технологии всегда были довольно-таки капризны и требовали постоянного внимания со стороны драйверописателей. В рамках Direct3D 11 функцию разделения нагрузки между несколькими видеоадаптерами целиком выполняет драйвер. Игровой движок, как и в случае одиночного GPU, отдает команды общей очередью, а драйвер распределяет их так, чтобы, пока первый графический процессор создает свой кадр видеоряда, второй GPU занимается следующим кадром (метод AFR — Alternate Frame Rendering). Для полноты картины стоит заметить, что мультиадаптерный рендеринг не сводится к AFR. В редких случаях используется метод SFR (Split Screen Rendering), в котором каждый GPU обрабатывает свою часть единого кадра, а Direct3D 12 предусматривает и более сложные режимы, но о последнем — чуть позже.

В идеале процедура мультиадаптерного рендринга в Direct3D 11 прозрачна для игрового движка и не требует дополнительных усилий от его разработчиков, но на практике все совсем не так просто. При использовании метода AFR нужно считаться с ограничениями в тех ситуациях, когда существуют зависимости между последовательными кадрами, а это практически неизбежно в современных играх. Как следствие, адекватная работа мультиадаптерной системы возможна только при наличии профилей настроек для каждой конкретной игры, благодаря которым драйвер получает подсказки о том, чем занимается движок, а разработчикам игры — в идеале — нужно понимать, что пытается сделать драйвер. Полезно использовать и проприетарный API (такой как NVAPI для GPU NVIDIA), открывающий доступ к GPU в обход уровня абстракции Direct3D, но даже в идеальных условиях не от каждой игры можно добиться хорошего масштабирования быстродействия на нескольких адаптерах.

Свой вклад в эту проблему вносит и пресловутая «процессорозависимость»: графические чипы сейчас развиваются быстрее, нежели быстродействие CPU архитектуры x86 с небольшим числом потоков, и это заметно даже в конфигурациях с одной мощной видеокартой, не говоря уже о двух. Наконец, как мы раз за разом видим по результатам группового теста GPU в какой-нибудь популярной игре, единственный адаптер высшего эшелона, скорее всего, удовлетворит любого геймера. С другой стороны, и разница в качестве изображения между низкими и максимальными настройками качества графики уже не та, что в золотые времена SLI и CrossFire. В результате побуждение наращивать кадровую частоту любой ценой сошло на нет, а раз так, то какой смысл для людей, работающих над драйверами GPU, вкладывать усилия в нишевую технологию мультиадаптерного рендеринга? Пока работа продолжается (особенно со стороны NVIDIA), но с пришествием Direct3D 12 ситуация может полностью измениться — причем как в лучшую, так и в худшую сторону.

⇡#Мультиадаптерный рендеринг в Direct3D 12

Новый графический API Microsoft предусматривает два различных подхода к программированию мультиадаптерного рендеринга. В режиме Implicit Multi-Adapter задачу разделения работы между GPU выполняет драйвер — как в Direct3D 11, со всеми его плюсами и минусами. С другой стороны, в режиме Explicit Multi-Adapter ресурсами графических процессоров целиком распоряжается игровой движок, и это одновременно и благословение, и проклятие, ведь в таком случае все зависит от готовности разработчиков вкладывать силы в поддержку Multi-Adapter.

При должном старании программисты смогут извлечь из связки GPU быстродействие, принципиально недостижимое в предыдущей версии API. В частности, можно отказаться от AFR и применять сложные методы распределения нагрузки между адаптерами — такие как конвейеризация кадров (Frame Pipelining), при которой несколько GPU выполняют различные этапы рендеринга одного кадра, а проблема зависимостей между соседними кадрами отсутствует как таковая. Кроме того, конвейеризацию можно использовать в пользу качества рендеринга, а не частоты смены кадров. К примеру, загрузить второй GPU расчетом глобального освещения, трассировки лучей, физики и так далее.

У Explicit Multi-Adapter есть два метода реализации: Linked Node и Unlinked Node. Первый метод — это аналог SLI и CrossFire в рамках новой парадигмы мультиадаптерного рендеринга. Как и в этих проприетарных технологиях, работающих на уровне драйвера под Direct3D 11, здесь несколько адаптеров представлены общими очередями команд: графика, вычисления общего назначения и очередь Copy для передачи данных по шине PCI Express. Проще говоря, игра «видит» несколько адаптеров как один, а принадлежность команды определенному GPU определяется так называемой маской узла.

Direct3D 12 Linked Node

Linked Node имеет несколько важных достоинств. В первую очередь, подразумевается общая архитектура и производительность узлов, что существенно упрощает задачу балансировки нагрузки. Также Linked Node позволяет узлам напрямую обращаться к оперативной памяти друг друга, минуя системную RAM. Наконец, при рендеринге методом AFR возможна передача кадров «ведущему» узлу через интерфейсы, отличные от PCI Express (то есть мостики SLI, поскольку AMD давно избавилась от специализированной шины в CrossFire).

В свою очередь, в Unlinked Node каждый узел предоставляет собственный набор очередей инструкций и допускает максимально гибкое управление ресурсами GPU. В частности, возможны асимметричные конфигурации из адаптеров неодинаковой мощности и различной архитектуры. Вполне жизнеспособна даже комбинация устройств AMD и NVIDIA в одной системе. Не менее заманчива возможность увеличить быстродействие дискретной графики за счет встроенного в центральный процессор GPU, который сможет выполнять финальные стадии обработки кадра (фактически, это частный случай конвейеризации кадров, и он не требует тщательной балансировки нагрузки, неизбежной в асимметричных связках GPU).

Переход графических адаптеров в Linked Node осуществляется на уровне драйвера, а для пользователя — включением опции SLI или CrossFire в настройках. Тем не менее не всякая игра сможет использовать адаптеры в Linked Node или, напротив, Unlinked Node. К примеру, Ashes of the Singilarity требует активации Unlinked Node, а остальные из наших тестов работают только в режиме Linked.

Direct3D 12 Unlinked Node

Чтобы получить Linked Node под Direct3D 12 на видеокартах NVIDIA, нужно связать их мостиком, иначе драйвер просто не даст включить SLI. Как сказано выше, Direct3D 12 позволяет использовать мостики по назначению в связанном режиме, но мы проверили: ни в одной из тестовых игр нет разницы по кадровой частоте между современным мостом HB SLI Bridge и простым гибким мостиком, которая в противном случае обязательно бы возникла. С одной стороны, это проблема, ведь мостик обеспечивает необходимую пропускную способность для передачи кадров между GPU в обход шины PCI Express даже в таких тяжелых режимах, как 4К. С другой, жесткие мостики с подсветкой, которые способны работать в двухканальном режиме и на повышенной частоте, — дорогое удовольствие, а в Direct3D 12 можно обойтись копеечным гибким интерфейсом.

Что такое Nvidia SLI

Для любого вычислительного компонента, будь то процессор или GPU, есть несколько путей развития. Самый банальный — это взять и нарастить частоту. При этом производительность будет расти почти линейно, но вот тепловыделение будет расти по кубическому закону (почему — ответ в этой статье). Второй способ — оптимизация самого процессора: доработка конвейера, оптимизация инструкций, изменение типа транзисторов и так далее. Способ хорош тем, что даже сейчас позволяет поднять производительность на 5-7% за поколение, но это явно не тот прирост, которого все ждут. Ну и третий способ — это уменьшение техпроцесса: при этом снижается и рабочее напряжение процессора, а значит и его тепловыделение, что позволяет, к примеру, увеличить его частоту. Однако чем меньше техпроцесс, тем труднее его сделать еще меньше: к пример, Intel «сидит» на 14 нм уже третий год, и неизвестно, когда перейдет на 10 нм.

Перенесемся на 13 лет назад — времена Pentium 4. Частоту наращивать выше 3.5 ГГц было не эффективно — процессор и так был очень горячим. Перевод его на более низкий техпроцесс и тем более оптимизация — процесс долгий, а AMD со своими Athlon не ждет. И тогда Intel решила зайти с другой стороны — сделать двухядерный процессор, но на несколько более низких частотах. В итоге тепловыделение осталось на том же уровне, а вот производительность повысилась. Позже появились пользовательские 4ядерные процессоры, потом 6ядерные, ну и апогей — 8ядерные Ryzen. И этот процесс, разумеется, будет продолжаться дальше.

А что же происходит на рынке видеокарт? В принципе — тоже самое. «Одноголовых» решений хватало и хватает обычным игрокам, но для про-геймеров компания 3dfx в 1998 сделал тоже, что и Intel 7 годами позже — выпустила «двухголовую» видеокарту.

История появления SLI

Как я уже написал выше, в 1998 году компания 3dfx представила технологию SLI (англ. Scan Line Interleave — чередование строчек), с помощью которой могли работать вместе два чипа Voodoo2:

Это давало невероятные по тем временам возможности — запуск игр в разрешении 1024х768. Однако проблем так же хватало — это и повышенное тепловыделение, и цена (600 долларов). Увы — идея не особо прижилась из-за того, что софта, который умел задействовать оба чипа, практически не было, и в итоге через пару лет линейка Voodoo5 оказалась просто провальной — продали всего 200 видеокарт, из которых реально работало около сотни. Это, а также другие ошибки 3dfx, привели к тому, что компания была куплена Nvidia за 110 миллионов долларов в 2001 году.

В Nvidia, конечно же, оценили SLI, но вот проблема в том, что тогда получил развитие AGP-порт, который был на материнских платах только один, так что идея SLI на двух разных видеокартах, увы, провалилась (хотя видеокарты с двумя графическими чипами все же производились, но, скорее, как исключения).

В 2004 году появилась шина PCI-E, которая активно используется до сих пор. И одним из ее плюсов было деление линий — то есть можно было сделать два порта по х4 или один по х8. Стали появляться материнские платы с двумя портами PCI-E, и тогда же Nvidia «перезапустила» SLI — теперь он расшифровывается как Scalable Link Interface (масштабируемый интерфейс). Увы — изначально (да и сейчас) были все те же проблемы, что и у 3dfx: нужно было оптимизировать драйвера под использование 2 видеокарт, и нужно было «пинать» разработчиков игр, чтобы они оптимизировали их под SLI. Это делали далеко не все, поэтому особого толку от SLI тогда не было: люди переплачивали вдвое, а прирост в играх в лучшем случае был 50-60%, а в некоторых случаях fps от использования SLI даже падал.

Но Nvidia не сдавалась — в 2007 году был представлен Triple-SLI, позволяющий подключать уже 3 видеокарты вместе, и даже годом раньше появился не совсем честный Quad-SLI: можно было подключать вместе две двухчиповых видеокарты (GeForce 7900GX2), что давало 4 работающих вместе GPU. В теории Nvidia обещала, что 3 видеокарты могут работать вместе до 2.5 раз быстрее, чем одна. На практике, увы, все было еще хуже, чем с 2 картами.

Алгоритмы построения изображения с использованием SLI

Самый простой алгоритм — Split Frame Rendering (раздельный рендеринг кадра). Он заключается в том, что кадр делится поровну между всеми видеокартами в системе:

Плюсы очевидны — картинку можно без проблем поделить и на 2, и на 3, и на 4, и даже на 10 кусков, то есть в теории количество одновременно работающих видеокарт не ограничено. Но проблемы, увы, тоже есть — у каждого участка кадра своя сложность, и поэтому все видеокарты ждут, пока одна из них не обработает свой самый трудный участок. Из-за этого видеокарты временами работают неэффективно, и в итоге fps оказывается ниже того, что мог быть.

Второй алгоритм, вытекающий из первого — Alternate Frame Rendering (чередующийся рендеринг кадра). Он заключается в том, что все видеокарты обрабатывают кадры по очереди: к примеру, если их две, то одна обрабатывает все четные кадры, а другая — все нечетные:

Плюсы все те же — таким образом можно распараллелить загрузку между любым количеством видеокарт. Минусов тоже хватает — начиная с того, что сложность кадров может быть разной (а значит опять же возможны задержки), и заканчивая тем, что в видеопамяти теперь должен храниться не один кадр как раньше, а уже два — то есть требуется больше видеопамяти (вообще говоря, я несколько утрирую — один кадр это минимум, в современных играх видеокарта может хранить и 5 последующих кадров в буфере).

К слову, в Quad-SLI с двумя двухчиповыми видеокартами используется объединение технологий выше — одна двухчиповая видеокарта использует SFR, то есть разделение кадра на две части, а в сумме обе видеокарты работают по AFR — то есть чередуют кадры. Но, как не трудно догадаться, проблем с организацией всего этого множество, поэтому прирост производительности гораздо ниже ожидаемого 4кратного.

Еще один алгоритм построения изображения, SLI AA (Anti Aliasing, сглаживание), качественно отличается от предыдущих — он заточен не на повышение fps, а на улучшение качества картинки: один кадр генерируется на всех видеокартах, и последовательно частично сглаживается сначала на одной, потом на другой (то есть сглаживание идет с некоторым шагом). В итоге на выходе мы получаем картинку с тем же fps, что и у одиночной видеокарты (ну или несколько выше), но гораздо более четкую — может быть даже х32 сглаживание!

Однако SLI может использоваться не только для прямого распараллеливания нагрузки — к примеру, у Nvidia есть PhysX SLI — он заключается в том, что одна видеокарта (самая мощная) обрабатывает графику, а другая (более слабая) — PhysX-эффекты (дым, огонь, эффекты ткани и так далее). Так же есть так называемый Hybrid SLI — это работа интегрированной в процессор видеокарты вместе с дискретной. Увы — как и следовало ожидать, прироста от этого не было, поэтому эта технология трансформировалась в Nvidia Optimus, где картинку может рендерить или дискретная, или интегрированная видеокарта, ну а на экран картинку всегда выводит интегрированная (чтобы не было заметного переключения между видеокартами).

Требования для системы с видеокартами в SLI

Так как мы подключаем сразу несколько видеокарт, то на материнской плате должно быть столько же слотов PCI-E, сколько будет подключено видеокарт. В принципе для работы одной карты хватает даже х4 скорости, поэтому на современных материнских платах обычно ставят до 3 портов, в итоге получается режим х8+х4+х4. Второе очевидное требование — это блок питания, с, во-первых, достаточной мощностью (700 и выше ватт), и, во-вторых, с нужным количеством 6 и 8-пиновых коннекторов для дополнительного питания видеокарты. Также для работы требуется специальный SLI-мостик для соединения видеокарт напрямую:

Разумеется, можно передавать данные напрямую через PCI-E, и раньше так делали, но сейчас объем данных настолько велик, что их передача по PCI-E существенно бы снизила производительность (так как сам интерфейс PCI не очень-то и быстрый, особенно если используются всего 4 линии). Также требуются видеокарты с поддержкой SLI — их легко определить по специальным контактам для подсоединения мостика. Еще одно важное требование — мощный процессор: чем выше fps, тем выше нагрузка на процессор, к тому же ему придется синхронизировать видеочипы между собой.

Самое основное — какие видеокарты объединяются в SLI. Во-первых, для корректной работы это должны быть видеокарты одной линейки (но не обязательно одинаковых производителей). Объем памяти ограничивается наименьшим объемом из все видеокарт (только в играх под DX 11 — в DX 12 память может суммироваться). Все остальное — версии BIOS, частоты и так далее — не важно.

Ну и самый главный вопрос — а стоит ли вообще делать SLI? Мой ответ — нет, исключение — вы очень требовательный геймер и хотите играть в 8К60. Посудите сами — самой мощной пользовательской одночиповой видеокарты, 1080 Ti, без проблем хватает на максимальные настройки даже в 2К, в 4К для 60 fps в самых требовательных играх придется чуть убрать сглаживание и эффекты. То есть обычному геймеру этой видеокарты просто заглаза. Заморачиваться с SLI стоит, если у вас, к примеру, 120 гц 4К монитор, или парочка 4К 60 гц мониторов — в таком случае да, SLI имеет смысл для достижения плавности картинки на максимальных настройках в обоих случаях, но и тут нужно понимать, что не во всех играх от SLI будет существенный прирост, поэтому все равно в некоторых играх придется или снижать графику, или «терпеть» fps ниже 60. Так что увы — если в процессорах многоядерность давно стала нормой, в мире видеокарт пока все еще правят «одноголовые» решения.

SLI: подключение видеокарт для совместной работы

После руководства по подключению в Crossfire двух видеокарт AMD Radeon пришел черед и компании Nvidia. Ее графические процессоры GeForce пользуются не меньшей популярностью среди игроков, чем продукция конкурента. Обе компании нога в ногу шагают на рынке, предлагая клиентам решения, схожие по уровню производительности и цене. Поэтому было бы несправедливо посвятить материал построению конфигурации CrossFire, но обойти стороной аналогичные возможности продуктов Nvidia.

Немного истории

Началом эры SLI можно считать 1998 год. Тогда компания 3dfx впервые сумела реализовать возможность объединения нескольких видеокарт для решения одной задачи. Однако развитие интерфейса AGP затормозило разработки в этом направлении, так как все материнские платы того времени оснащались только одним слотом для видеоплаты.

SLI от 3DFX — «дедушка» современной технологии

После того, как в 2001 году 3dfx были куплены компанией Nvidia, все разработки в этом направлении ожидали своего часа, который наступил только в 2004 году. Именно тогда, в 6000-й серии GeForce (первые видеокарты, разработанные специально под новейший на то время интерфейс PCI-Express) имеющиеся разработки были усовершенствованы и внедрены в продукты массового потребления.

SLI из двух GeForce 6600GT

Сперва объединить можно было две видеокарты GeForce 6600 или 6800, с выходом 7000-й серии (в которой была представлена первая полноценная двухпроцессорная плата от Nvidia, 7900GX2) появилась возможность построения четырехпроцессорной конфигурации (из 2 карт), а позже стало возможным и сочетание 3 или 4 раздельных ГП.

Как объединить видеокарты в SLI: требования

Как и для CrossFire, недостаточно купить две видеокарты Nvidia, чтобы сконфигурировать их в SLI. Существует ряд требований к компьютеру, которые следует соблюдать для обеспечения нормального функционирования связки.

  • Совместимые видеокарты . Как и для CrossFire, платы не обязательно должны быть идентичными, но построенными на одном процессоре. То есть, можно объединить видеокарты GeForce GTX960 от Asus и Gigabyte, но нельзя построить SLI из GTX750Ti и GTX960 от Palit. Рекомендуется использовать GPU с идентичными объемами памяти. Конфигурация из карт на 1 и 2 Гб если и заработает – использоваться будет меньший объем, а при различиях в скорости памяти (например, 2 Гб DDR3 и 1 Гб GDDR5) существует риск возникновения программных ошибок, приводящих к некорректному формированию изображения. Для обеспечения функционирования SLI требуются карты, оснащенные интерфейсом SLI и соединенные с помощью мостика. Возможно и объединение их программным путем, но в таком случае быстродействие системы будет ниже.
  • Подходящая системная плата . В плане поддержки чипсетами ситуация со SLI обстоит лучше, чем с CrossFire. Advanced Micro Devices решили обойтись без «палок в колесах» геймерам, использующим платы на наборах логики конкурентов, поэтому на чипсетах AMD 900-й серии присутствует поддержка обеих технологий объединения видеокарт. Чипы Intel тоже совместимы со SLI, что немаловажно. Само собой, в Nvidia не могли обойти стороной «родные» наборы микросхем серии NForce, топовые версии которых делают изначально SLI-совместимыми. Конечно, наличия подходящего чипсета недостаточно: на самой плате должно быть соответствующее количество гнезд PCI-Express. Рекомендуется использовать продукты, созданные для геймеров, где к каждому слоту подведено 16 или 8 линий PCI-E. В случае с бюджетными системными платами следует быть особо внимательным: подавляющее большинство геймеров, покупающих такие гаджеты, функций SLI никогда не использует, а «материнки» с двумя слотами PCI-E приобретаются ими «на всякий случай». Производители знают это и потому часто делают второй разъем неполноценным: подводят к нему 4, 2 или даже 1 линию, вместо 16 или 8. SLI на таких платах если и будет функционировать (не факт: нужно смотреть на коробке платы логотип SLI), то возможности видеокарт не будут раскрыты до конца.

Несмотря на наличие трех полноразмерных слотов X16, все 16 линий подведены только к первому. Слот 2 оснащен восемью линиями, слот 3 — только четырьмя

Таким логотипом маркируются SLI-совместимые комплектующие

Какие видеокарты можно объединить в SLI

Подключение двух видеокарт SLI -мостиком возможно, только если для этого мостика предусмотрен интерфейс на плате. Программными средствами объединить их тоже можно попытаться, но без «плясок с бубном» в таком случае не обойтись. Да и не имеет смысла строить тандем из двух GT610 или GT720. Одна карточка, быстродействие которой окажется выше, чем у подобной связки, в 2 или 3 раза, обойдется дешевле, чем комплект из пары офисных карт и совместимой материнской платы. То есть, отсутствие на младших представителях графических ускорителей SLI-интерфейса вызвано вовсе не жадностью производителя. Мостики никто не ставит, потому что это сделает карту дороже, но смысла от них никакого не будет. Таким образом, подключение двух видеокарт SL I возможно для моделей среднего и топового класса. К таковым относятся ГП, вторая цифра названия которых – 5 и выше (GTX5 5 0Ti, GTX9 6 0, GTX6 7 0, GTX7 8 0 и т.д.).

У GeForce GT 720 нет мостика для SLI

Перед тем , как подключить SLI две видеокарты , стоит убедиться в том, что они построены на одной версии графического процессора. К примеру, GeForce GTX650 и GTX650Ti, несмотря на схожесть названий, функционируют на базе совершенно разных ГП и потому в тандеме работать не смогут.

Есть ли практическая польза от SLI?

Перед тем, как объединить видеокарты в SLI, желательно ознакомиться с опытом использования таких конфигураций другими геймерами и изучить спецификации своих карт, а также характеристики более производительных решений в линейке. Нередко ни в плане экономии, ни по производительности, выигрыша двухкарточная конфигурация не дает. К примеру, две GTX950 в SLI демонстрируют результаты, сравнимые с одной GTX970. Разница в цене (около 200 и 400 долларов, соответственно) самих карт оправдана, но если учесть дополнительные затраты на мощный БП, двухслотовую материнскую плату, качественный и хорошо вентилируемый корпус – выглядит она сомнительно.

Совсем иная ситуация, если подключение двух видеокарт SLI – составляющая часть процедуры апгрейда имеющегося ПК, купленного пару лет назад. Карточки уровня GTX650Ti или GTX750 все еще можно встретить в продаже по разумной цене (разница с новыми моделями примерно эквивалентна различиям по быстродействию), а технический прогресс за 3 года не преподнес ничего революционного для видеокарт (разве что память HBM, представленную AMD, но Nvidia это пока не касается). Поэтому добавление еще одного графического процессора – вполне рациональный шаг для таких игроков.

SLI: подключение видеокарт

Если компьютер соответствует требованиям для создания SLI-конфигурации, подходящая вторая видеокарта куплена – можно переходить к сборке. После выключения ПК следует снять крышку системного блока, установить вторую плату в соответствующий слот, подключить к ней дополнительный кабель питания (если таковой требуется) и соединить две карты мостиком, идущим в комплекте. Аппаратное подключение двух видеокарт в SLI на этом завершено и можно переходить к программной настройке.

Кабели питания, подключенные к связке SLI

Подключение двух видеокарт SLI в Windows

Для того, чтобы связка из двух ГП могла нормально функционировать – нужно установить на ПК Windows версии Vista или новее (7, 8, 8.1 или 10). Рекомендуется также скачать с сайта Nvidia самую свежую версию драйвера для видеокарты. После этого можно переходить к настройке.

  • Нужно кликнуть по рабочему столу правой клавишей мыши и в появившемся окне выбрать пункт «Панель управления Nvidia».
  • В подменю «Настройки 3D» следует выбрать пункт «Настроить SLI, PhysX».
  • В открывшейся вкладке необходимо установить галочку «Максимальная производительность 3D».

Включение SLI в Windows

После применения установок связка готова к работе. Возможно, для корректной настройки работы SLI в некоторых играх придется задать им особые параметры в подменю «Программные настройки». Но, как правило, большинство современного ПО в этом не нуждается.

Большой поклонник качественной китайской техники, любитель четких экранов. Сторонник здоровой конкуренции между производителями. Чутко следит за новостями в мире смартфонов, процессоров, видеокарт и другого железа.

Понравилась статья? Поделиться с друзьями:
Добавить комментарий

;-) :| :x :twisted: :smile: :shock: :sad: :roll: :razz: :oops: :o :mrgreen: :lol: :idea: :grin: :evil: :cry: :cool: :arrow: :???: :?: :!:

5 + семь =