Complicaciones de 7nm de Zen2: ¿Por qué no todos los núcleos Ryzen 3000? …

Complicaciones de 7nm de Zen2: ¿Por qué no todos los núcleos Ryzen 3000? …
4.9 (98.46%) 13 votos

Crédito: AMDCrédito: AMDNo estamos acostumbrados a que AMD sea el objetivo de la ira de los entusiastas, pero la aparente incapacidad de Ryzen 3000 para golpear sus relojes de impulso anunciados ha generado quejas en foros de entusiastas y reddit. Realizamos una serie de pruebas para determinar si nuestro Ryzen 5 3600X, que compramos en el comercio minorista, puede llegar a su publicidad 4.4 Reloj de impulso de GHz. Descubrimos varias cosas nuevas en el camino. Compartimos nuestros descubrimientos con AMD antes de su publicación, y la compañía ha confirmado varios de nuestros hallazgos.

El TLDR:

  • Solo un núcleo en nuestro Ryzen 5 El procesador 3600X alcanzará la frecuencia de refuerzo nominal de AMD. AMD confirmó que algunos núcleos en los procesadores Ryzen de la serie 3000 son más rápidos que otros, lo que se denota en Ryzen Master. Eso significa que no todos los núcleos pueden alcanzar las frecuencias turbo de un solo núcleo. En cambio, hay una mezcla de núcleos rápidos y lentos.
  • Grabamos hasta una diferencia de ~ 75 – 100MHz entre los núcleos más rápidos y más lentos, con solo un núcleo que alcanza la frecuencia de refuerzo de un solo núcleo. AMD no ha compartido la definición de la frecuencia que es aceptable para núcleos más lentos (es racional esperar que esta sea la frecuencia base). Si bien registramos deltas de frecuencia relativamente pequeñas en nuestra muestra, afecta el rendimiento y denota un cambio en la estrategia de agrupamiento de AMD en comparación con el rendimiento turbo por núcleo de Zen / Zen +.
  • Los procesadores Ryzen de la generación anterior pueden alcanzar frecuencias de impulso en todos los núcleos. Intel también dice que sus procesadores pueden alcanzar la frecuencia turbo en todos los núcleos.
  • Las cargas de trabajo que se ejecutan en los núcleos más lentos de Ryzen 3000 experimentan frecuencias más bajas que la velocidad de impulso nominal del chip y, por lo tanto, un rendimiento más bajo.
  • La combinación de Windows El nuevo programador compatible con Ryzen de 10 y los controladores de chipset de AMD permiten que el sistema operativo programe tareas de subproceso único en los núcleos más rápidos (fijación de subprocesos). AMD ha revelado previamente el Windows 10 programador y la función CPCC2, pero no es que las funciones combinadas asignen hilos a los núcleos más rápidos. Esta funcionalidad requiere la última versión de Windows 10. Esto es algo similar al Turbo Boost Max de Intel 3.0 en sus procesadores HEDT, pero Intel no establece esto como un requisito para alcanzar el Turbo Boost normal 2.0 velocidades de reloj.
  • Versiones anteriores de Windows no puede programar subprocesos en los núcleos más rápidos de manera eficiente, lo que resulta en frecuencias de reloj más bajas y rendimiento para los procesadores Ryzen serie 3000 en algunas cargas de trabajo, lo que puede ser la raíz de muchas quejas de los usuarios.
  • La mayoría de las utilidades de prueba no miden el rendimiento lo suficientemente rápido como para detectar la actividad de impulso de frecuencia de ráfaga. Tampoco miden ciertos tipos de estados de energía que podrían indicar una mayor actividad de impulso.
  • Nosotros teorizar los núcleos más lentos podrían ser un factor que contribuye a los techos de overclock bajos con los procesadores Ryzen 3000. Los procesadores de la serie Ryzen 3000 alcanzan overclocks de núcleo completo 200-300MHz por debajo de la frecuencia de refuerzo de núcleo único. Los núcleos más lentos simplemente no pueden lograr / mantener frecuencias más altas, por lo tanto, sirven como el eslabón más débil de la cadena.

Dirígete al final de la página para ver los detalles de la prueba. Por ahora, echemos un vistazo a nuestros resultados.

Ryzen 5 Potenciador de precisión 3600X 2 Comportamiento

Realizamos una serie de pruebas de un solo hilo o ligeramente en sucesión rápida. La prueba comienza con cinco iteraciones de una carga de trabajo LAME (~ 35 segundos cada una) que son inherentemente de un solo subproceso. Esto es seguido por una ejecución cada uno de POV-RAY y Cinbench R20, ambos en modo de prueba de un solo núcleo. Los procesadores AMD reducen la marcha según los requisitos de potencia de las instrucciones de la tarea, por lo que estas pruebas de subproceso único nos brindan la mejor oportunidad de capturar la actividad de impulso de un solo núcleo.

Recomendamos:  ¿Qué es AirDroid y cómo funciona en dispositivos móviles?

Nuestro primer gráfico en el álbum a continuación cuantifica la frecuencia de todos los núcleos durante una sola ejecución de la prueba, y cada punto representa una medición de frecuencia. Cada color corresponde a un núcleo diferente. Con seis núcleos golpeando, eso nos da un total de ~ 12,500 puntos de datos en el gráfico. Naturalmente, eso significa que algunas mediciones se superpondrán, por lo que también proporcionamos gráficos de frecuencia para cada núcleo individual durante la misma ejecución.

Como puede ver arriba, pudimos registrar períodos sostenidos de actividad de impulso, aunque en 4.35 GHz, que está por debajo de los chips clasificados 4.4 Frecuencia de aumento de precisión de GHz. Podríamos atribuir esto al método en el que nuestra utilidad de prueba mide el rendimiento, su incapacidad para capturar ciertos estados de potencia (entrada CC6, puerta PC6) o simplemente la falta de frecuencias pico súper rápidas de corta duración debido al intervalo de sondeo de 100 ms.

En cualquier caso, esto está cerca de la calificación 4.5 GHz aumenta la velocidad del chip, pero solo ocurre en un solo núcleo. Las tablas de frecuencia por núcleo muestran claramente que Core 4 es el único núcleo que impulsa a 4.35 GHz.

Por lo general, veríamos más saltos de frecuencia intercalados entre los núcleos, en gran parte debido a la Windows Tendencia irritante y aparentemente irracional del planificador de asignar hilos en diferentes núcleos por capricho. Esto normalmente sucede a menudo, por lo que Core 4La velocidad de impulso sostenida y el hecho de que otros núcleos no están aumentando 4.35 GHz en absoluto, se destaca como anormal dado el comportamiento típico del planificador. También ayuda a orientarnos en la dirección correcta con respecto a la utilización del núcleo.

Para mayor claridad, trazamos la utilización de subprocesos para ver qué núcleos estaban activos durante las cargas de trabajo. Como se trata de un procesador de 12 subprocesos, eso significa que tenemos un total de ~ 25,000 puntos de datos, por lo que se aplican las mismas reglas de mediciones superpuestas. Los gráficos en este álbum muestran los datos para una ejecución de referencia única. El primer gráfico muestra todos los núcleos simultáneamente. Los otros gráficos muestran los datos solo para ese núcleo.

Como podemos ver en Core 4El cuadro de desglose es, con mucho, el más activo. De hecho, es el único núcleo que alcanza el 100% de utilización durante las pruebas.

Parece que el sistema operativo está programando cada una de nuestras pruebas de referencia en el mismo núcleo, cada vez. Si todos los núcleos pudieran lograr el mismo impulso, esperaríamos diferentes núcleos cada vez en función de las térmicas localizadas. Pero no: tenemos Core 4 cada vez. ¿Por qué? Lo único con lo que se correlaciona es que Ryzen Master lo muestra como el mejor núcleo del chip. Complicaciones de 7nm de Zen2: ¿Por qué no todos los núcleos Ryzen 3000? ... 1

El software Ryzen Master de AMD marca cuatro núcleos como los más rápidos en cualquier chip dado, pero estas asignaciones son diferentes para cada chip en función de la calidad de los núcleos. En la 'Sección de núcleos', Ryzen Master marca el núcleo más rápido en cada CCX con una estrella, mientras que un núcleo (Core 4 en nuestro chip) está marcado con una estrella de oro. Eso denota que este es el núcleo más rápido en todo el chip. El software también marca dos núcleos con círculos, que son los segundos núcleos más rápidos en cada CCX. AMD comenzó a marcar los núcleos más rápidos con los procesadores Threadripper, pero posicionó la característica como permitiendo a los entusiastas determinar qué núcleos podrían soportar overclocks individuales más altos.

El siguiente curso lógico de acción es deshabilitar Core 4 para ver si algún otro núcleo golpeará el 4Velocidad máxima de .35 GHz. Entonces, ¿qué sucede si deshabilitamos los cuatro núcleos más rápidos? Llegaremos allí en breve en las páginas siguientes, pero primero tenemos que cubrir el nuevo esquema del planificador para que esos resultados sean más comprensibles.

Recomendamos:  ¿Vale la pena pagar PLN 2.500 por un altavoz? Sonos Play:5 - revisión

Fijar hilos en los núcleos más rápidos

Para una prueba de cordura rápida, probamos un Intel Core i5-9600K con la misma revisión del sistema operativo para asegurarnos de que no haya habido un cambio en el Windows planificador La conclusión clave aquí es que las cargas de trabajo migran entre los núcleos de -9600K. Este es el comportamiento tradicional del planificador al que estamos acostumbrados, pero va en contra de los resultados de las pruebas que obtuvimos del Ryzen. 5 3600X.

Aquí podemos ver que el Core i5-9600K aumenta a 4.52, en un momento u otro, en todos los núcleos durante los puntos de referencia. (Notará que el -9600K completa las cargas de trabajo más rápido que el Ryzen 5 3600X, como se denota por la línea más corta. Esto se debe a que estas cargas de trabajo se basan en completar una carga de trabajo específica, en lugar de estar limitadas artificialmente por una restricción de tiempo).

La velocidad de impulso máxima de -9600K está por debajo del valor nominal 4.6 Aumento de GHz. Desafortunadamente, la placa base de MSI ajusta dinámicamente el BCLK durante nuestras pruebas, con una tendencia general de que esté entre 100.4 y 100.6 MHz, que enturbia las mediciones. Sin embargo, el multiplicador nunca supera los 45. Intel otorga a los proveedores de placas base una amplia libertad con todos los diversos componentes que comprenden su política Turbo Boost, por lo que parte de la velocidad inferior al impulso puede ser el resultado de los parámetros específicos de MSI. (Ahora hemos encontrado algo más para investigar más a fondo).

En contraste, el refuerzo de precisión de AMD 2 maneja los estados de potencia y, por lo tanto, la frecuencia dentro del chip, lo que significa que no debería afectar los resultados de nuestras pruebas con el procesador Ryzen.

Seguimos con AMD para obtener más claridad sobre por qué las cargas de trabajo de un solo subproceso están dirigidas al núcleo más rápido del 3600X, y la compañía aclaró:

Ryzen y el Windows 10 el programador puede cooperar para garantizar que esas cargas de trabajo más livianas lleguen a los núcleos más rápidos del procesador. En Ryzen Master, el núcleo más rápido en cada CCD está marcado con una estrella dorada, el segundo más rápido con estrellas grises. Identificar y priorizar los núcleos más rápidos ayuda a maximizar el rendimiento de 1T, y eso es parte de la funcionalidad CPPC2 que mencionamos anteriormente. La tercera generación de AMD Ryzen es parte de una audiencia saludable de procesadores en la historia reciente que se comportan de esta manera.

los Windows El planificador (que comienza con Win10 1809) también prioriza el llenado de un CCX completo con subprocesos de un proceso antes de mudarse a otro lugar (ya sea migración o subprocesos nuevos). Entonces, entre los núcleos más rápidos y la conciencia CCX, Windows La actualización del 10 de mayo de 2019 y el controlador del chipset AMD funcionan en concierto para ofrecer el máximo rendimiento.

AMD ha revelado su Control de rendimiento de potencia colaborativo 2 (CPCC2) en el lanzamiento de sus procesadores, pero que sepamos, la mensajería se centró en la característica que permite transiciones de estado de potencia más rápidas (lo que también hace), pero no funciona en concierto con el Windows 10 planificador para asignar hilos al núcleo más rápido. Tampoco podemos encontrar ninguna declaración al respecto en la guía del revisor, por lo que esto es una novedad para nosotros.

AMD también anunció el nuevo Ryzen-aware Windows 10 planificador, que según dijo está diseñado para fijar hilos dentro de un solo CCX antes de programarlos en un CCX adyacente. Una vez más, no se mencionó la asignación de hilos al núcleo más rápido, y esto no figura en la guía del revisor.

¿Entonces, Qué significa todo esto? Cada núcleo en un procesador tiene una capacidad de impulso máxima diferente, de ahí el desarrollo de Intel de su Turbo Boost Max 3.0 característica (para chips HEDT) que bloquea los hilos a núcleos preferidos que pueden aumentar más que otros. Sin embargo, todos los núcleos de Intel son capaces de alcanzar el Turbo Boost estándar 2.0 frecuencias, y de acuerdo con nuestras pruebas, también lo son todos los núcleos en los modelos Ryzen de la generación anterior.

Recomendamos:  ¿Qué es la migración a la nube?

Eso contrasta con la nueva política de AMD de solo tener ciertos núcleos que pueden alcanzar la frecuencia máxima. Eso significa que solo uno, o unos pocos, de los núcleos en cada procesador Ryzen necesitarían agruparse en el reloj de impulso de un solo núcleo anunciado para cumplir con los requisitos (quizás legales) de AMD, mientras que otros núcleos pueden tener un rendimiento más lento que no pueden alcanzar el reloj de impulso máximo.

Veamos cómo se ve cuando deshabilitamos los núcleos más rápidos en las siguientes páginas, y luego probaremos el Ryzen 5 3600X en una versión anterior de Windows para ver el impacto en el rendimiento y, finalmente, comparar la estrategia de agrupación de Ryzen 3000 con la agrupación de piezas de la serie 2000 de la compañía. Para aquellos que estén interesados, así es como lo probamos:

Metodología de prueba

Es importante tener en cuenta que las CPU modernas funcionan en el orden de miles de millones de ciclos por segundo (aunque cambiar los estados de energía requiere 1-2 ms para los procesadores Ryzen 3000), por lo que capturar una imagen precisa de la actividad de impulso requiere monitorear el procesador con configuraciones de sondeo granulares. La mayoría de las utilidades de la CPU sondean el procesador por sus estadísticas 'vitales' cada segundo, por lo que faltan transiciones de estado rápidas, pero muchas utilidades le permiten ajustar la granularidad.

Es notable que la sobrecarga del uso del sondeo granular puede generar una sobrecarga funcional adicional en el procesador, creando en efecto su propia carga de trabajo que afecta el rendimiento a través del 'efecto observador'. En pocas palabras, sondear el procesador con demasiada frecuencia puede afectar su rendimiento y cómo se comporta durante el período de observación, por lo que si bien buscamos una mayor precisión, también debemos evitar inyectar imprecisiones sondeando el procesador con demasiada frecuencia. Eso puede desencadenar diferentes estados de potencia que hacen que los datos de prueba sean inexactos.

Marcamos una tasa de sondeo de 100 ms para nuestras pruebas, lo que significa que consultamos el procesador cada 100 milisegundos y luego registramos el promedio de esas mediciones cada segundo. Esta configuración no pareció tener un impacto notable durante la actividad inactiva, pero debemos recordar que Windows también genera actividades en segundo plano (aparentemente al azar) que pueden causar picos en la actividad que son difíciles de atribuir a cualquier proceso específico.

Compramos nuestro Ryzen 5 3600X en el comercio minorista, por lo que estas pruebas son representativas de un procesador de envío. A menos que se indique explícitamente lo contrario, probamos con la última versión de Windows 10 Pro 1903, que tiene el nuevo programador compatible con Ryzen y los controladores del conjunto de chips AMD. Utilizamos el mismo equipo listado en nuestro Ryzen 5 Revisión 3600X para pruebas, así que dirígete a la página de configuración de prueba para obtener una lista del hardware.

Tenemos que advertir que el conjunto actual de herramientas de medición puede no ser capaz de capturar algunos estados de potencia y que los algoritmos de impulso oportunista de AMD responden de manera diferente a las corrientes, las temperaturas y la potencia del zócalo de VRM. Estamos probando con una de las placas base mejor equipadas en términos de suministro de energía, y un robusto enfriador Corsair H115i para intentar extraer el máximo rendimiento del chip en la configuración de stock. Existe la posibilidad de que algunos de estos resultados puedan variar en diferentes entornos de prueba, o de chip a chip, pero aprendimos lo suficiente como para detectar algunas tendencias en nuestras pruebas.

MÁS: Las mejores CPU

MÁS: Jerarquía de procesadores Intel y AMD

MÁS: todo el contenido de CPU

Dejános tus Comentarios: