¿Por qué la nueva computadora Met Office es un Cray?

Soporte y usabilidad.

No puede admitir un clúster construido en casa que haga 16PFLOP. Quiero decir, puedes, pero, ¿a quién llamas cuando cae boca abajo en el barro? Puede usar una capa en su área de tecnología, pero ¿qué sucede cuando su capa no cubre los problemas que tiene?

La confiabilidad no es solo la confiabilidad de los componentes y la estabilidad del sistema operativo (hardware básico y alguna base extendida del sistema operativo Linux, por ejemplo). Depende en gran medida de una entidad de soporte con un interés personal en hacer que sus sistemas sean confiables, lo que, en la mayoría de los casos, se asigna directamente a los requisitos contractuales de la organización de soporte para garantizar la funcionalidad del sistema del cliente. ¿Entiendes profundamente cómo funcionan todos estos componentes juntos? ¿Tiene acceso a los desarrolladores, directamente, que manejan problemas de funcionalidad, seguridad y compatibilidad? Si no lo hace, ¿cuánto tiempo pasará antes de que encuentre un problema que no tiene los recursos para resolver?

¿Sabes lo que es realmente caro? Un sistema que no está haciendo ningún trabajo. Entonces, mientras que usted y su equipo de sistemas de Monster-swilling están tratando de localizar un problema oscuro con su clúster construido en casa, sus usuarios muy caros no pueden producir desde su sistema. Y ningún tiempo de producción tiene un efecto de goteo en la rentabilidad de su empresa (o, de manera similar, en la capacidad de su organización para avanzar en la investigación).

Esto deja usabilidad. Suponga que hay varios códigos disponibles para varias GPU paralelas y clústeres híbridos. Sin embargo, cuando tiene un sistema que es un producto estandarizado y compatible, también tiene una base de productores de software que están construyendo específicamente para su plataforma. Esto significa que los códigos más populares y los códigos más probados están disponibles para su sistema (y esos códigos también son compatibles con sus respectivas compañías, lo que significa que tampoco depende de usted arreglar eso usted mismo). Esto hace que las capacidades de su sistema sean explotadas más fácilmente por sus clientes (siempre veré a mis usuarios como clientes, incluso si realmente son solo otros en la misma compañía), lo que hace que el valor del gasto se realice más fácilmente.

Política del Reino Unido

¿Puede Escocia decidir unilateralmente sobre su independencia, o requiere la aprobación legal de Westminster?

¿Por qué los laboristas obtuvieron escaños en las elecciones anticipadas de 2017?

¿Qué pasaría (paso a paso) si la Reina o el Rey del Reino Unido no aceptara un proyecto de ley aprobado por el Parlamento en contra del consejo de los ministros?

¿Qué pasaría si ningún partido (o candidatos independientes) decidiera postularse al poder, lo que significa que no hay candidatos (Reino Unido)?

¿Puede Narendra Modi convertirse en el mejor primer ministro que la India haya visto? ¿Por qué?

¿Por qué Australia, Canadá y Nueva Zelanda eligen retener a la Reina del Reino Unido como su jefe de estado? ¿Hay alguna ventaja? ¿Es en lugar de formar una alianza ya que la mayoría de las personas son esencialmente de las mismas raíces?

Tal vez podría hacerlo por menos usando GPU paralizadas, pero podría reflejar el rendimiento de 384 Xeon E5 integradas por gabinete con 256 MB por núcleo con flujo impecable y redundancias increíbles que se ejecutan en un kernel de Linux personalizado y un rendimiento de red que básicamente no ¿Existe en cualquier otro lugar del mundo y apoya a este monstruo las 24 horas del día, los 7 días de la semana, para cualquier aplicación ridícula en la que sus increíbles y diversos clientes pongan estas cosas en práctica?

Si es así, definitivamente deberías convertirte en un competidor de Cray, porque no hay tanta competencia a su nivel y probablemente intentarían comprarte por mucho dinero en poco tiempo. Solo digo.

Victor Eijkhout

¿Cuántas GPU necesitarías para 16 petaflop? ¿Dónde los va a colocar y cómo va a alimentarlos y enfriarlos? Y como la respuesta de Erik Fair a ¿Por qué la nueva computadora Met Office es un Cray? mencionado, ¿cómo vas a conectarlos en red? Una supercomputadora es mucho más que solo comprar los chips.

Como mencionas las GPU: un flop de GPU no es un flop de uso general. Es probable que Cray sea mucho más fácil de programar que el mismo número teórico de flops en las GPU.

Johnston Robert

Interconexión y organización del sistema. Y atención al cliente.

Relativamente, el hardware es fácil. Conectarlo todo y luego hacer que sea realmente útil (es decir, software) es más difícil.

Victor Eijkhout

Dejé el Met. oficina hace 45 años, pero al considerar las respuestas, tenga en cuenta que siempre han utilizado los mainframes más potentes conectados en una red de la OMM.

Victor Eijkhout

More Interesting

¿Seguirán los votantes o dejarán a los votantes enfrentar más consecuencias económicas negativas del resultado del Brexit?

¿De qué maneras podría el Reino Unido volverse más socialmente liberal?

Si se convierte en primer ministro, ¿es probable que Jeremy Corbyn sirva como primer ministro durante 10 años?

¿El público en general en el Reino Unido preferiría un Brexit duro o blando? ¿Por qué?

¿Es el sistema político británico mejor que el sistema político estadounidense?

¿Por qué algunos de la clase trabajadora votaron por Thatcher?

¿Cómo se sienten los británicos por ser controlados por el gobierno?

¿Qué hay detrás del reciente aumento en la membresía del partido verde en el Reino Unido?

¿Cuáles son las posibilidades de que Nigel Farage se convierta en primer ministro?

¿Qué promesas de gastos ha hecho Jeremy Corbyn?