Jaime Pizarroso, ¿se presenta a nuestros lectores por favor?
¡Hola a todos! Soy Jaime Pizarroso, profesor de Aprendizaje Profundo y Explicabilidad de la Inteligencia Artificial (IA) en ICAI, de la Universidad Pontificia Comillas. Nacido y criado en Madrid, siempre he tenido una inclinación hacia la tecnología a través de los ordenadores y los videojuegos… Soy una persona inquieta y, a la vez que hice el doctorado, trabajé un poco de todo: logística, transporte, espacio... ¡Ahora mismo hay diseños en parte míos orbitando la tierra! Sin embargo, siempre he dedicado una parte de mi vida a dar clase. Incluso en el colegio daba clase a mis compañeros que necesitaban más ayuda.
Y es precisamente lo que va a hacer Pizarroso con esta entrevista, ayudarnos a entender lo que ha supuesto la irrupción de DeepSeek en la galaxia de la IA, que además de DeepSeek, hay otros actores chinos en esta carrera, como Alibaba con su modelo Qwen “conocido por su precisión y eficiencia”, y que el gigante fabricante de chips, Nvidia, “en la actualidad, no tiene rival”.
“Yo, si fuera Jen-Hsun Huang (CEO de Nvidia), hubiera aprovechado para recomprar acciones cuando cayó la valoración y abrir una botella de champán”.
-Actualmente, Jaime Pizarroso trabaja… ¿en?
Gracias por invitarme a hacer esta entrevista.Actualmente me encuentro investigando el uso de los modelos grandes de lenguaje, LLMs por sus siglas en inglés, en la automatización de procesos.
-Lo primero, no me resisto… ¿me dice qué es exactamente enseñar ‘aprendizaje profundo y explicabilidad’?
Claro, lo primero es entender que la Inteligencia Artificial no se limita a modelos como ChatGPT, sino que abarca también robótica, sensores inteligentes y más. La IA es el campo que busca desarrollar sistemas capaces de realizar tareas que antes requerían inteligencia humana. Dentro de ella, el Aprendizaje Automático (Machine Learning) se enfoca en algoritmos que encuentran patrones en datos sin instrucciones explícitas, optimizando sus resultados con técnicas estadísticas.
El Aprendizaje Profundo (Deep Learning) es una rama de Machine Learning que trabaja con datos más complejos como imágenes, videos o texto, en lugar de tablas estructuradas. Para ello, usa redes neuronales, que son la base de modelos como ChatGPT o DeepSeek.
Actualmente, Nvidia es un monopolio de facto en este sector, sin alternativas que ofrezcan el mismo rendimiento y facilidad de uso
El problema es que estos modelos son tan avanzados que no siempre sabemos por qué generan ciertas respuestas. Aquí entra la Explicabilidad de la IA, que busca entender cómo un modelo toma sus decisiones. Esto nos ayuda a detectar sesgos, censura o incertidumbre en sus respuestas. Por ejemplo, si yo a ChatGPT le pregunto “¿Cuánto es 2+2?”, ChatGPT puede responder "4" o "El resultado de la operación 2+2 es 4", la explicabilidad nos permite analizar qué factores influyen en esas variaciones y garantizar que el modelo sea transparente y fiable.
-¿Le ha sorprendido la irrupción, de un día para otro, de DeepSeek, o era de esperar que ocurriera algo similiar?
En un sector con tanta velocidad de innovación, pocas cosas sorprenden del todo. Aunque DeepSeek parece haber irrumpido "de la noche a la mañana", su aparición responde a una carrera global por desarrollar modelos más potentes y eficientes. Lo inesperado no ha sido tanto que China haya creado un modelo equiparable a ChatGPT, sino el gasto que han declarado.
Al desarrollar modelos de IA, hay dos costes clave. El primero es el de desarrollo, que incluye infraestructura, electricidad y datos. Se ha dicho que DeepSeek ha gastado un 90% menos que OpenAI en esta fase, pero hay dudas sobre la veracidad de esta cifra. El segundo costo, más relevante para los usuarios, es el de inferencia, es decir, cuánto cuesta usar el modelo. Aquí es donde DeepSeek marca la diferencia: su uso podemos probar que es un 95% más barato que ChatGPT.
Además, han liberado tanto el modelo como su método de entrenamiento, lo que permite no solo descargarlo y ejecutarlo localmente sin depender de servidores fuera de la UE, sino también adaptar su entrenamiento para evitar sesgos específicos. Esto representa un avance significativo en accesibilidad y transparencia comparado con su contraparte americana.
-A ver, ¿los chinos, con DeepSeek, han hecho lo que suelen hacer cuando falsifican productos de lujo como, por ejemplo, un bolso de Prada?
Este es un debate abierto en la comunidad de IA. Según investigaciones independientes y Microsoft (inversor de OpenAI), parece que DeepSeek ha sido entrenado en parte con respuestas de ChatGPT, obtenidas mediante consultas controladas para generar un conjunto de datos. Si esto es cierto, sería una pequeña decepción, ya que implicaría que para entrenar modelos eficientes de forma "barata" se requiere uno previo entrenado de forma "cara".
El 20% de la facturación de Nvidia en 2023 provino de Singapur, un país demasiado pequeño para justificar tal consumo. Esto sugiere que siguen llegando a empresas chinas, iranís o norcoreanas mediante canales no oficiales
Aquí de todas formas me gustaría que vuestros lectores dejaran a un lado sus prejuicios sobre China y pensaran si esto es compatible con sus propios valores personales. Digo esto porque, incluso si esto ha sido el caso, el propio ChatGPT se entrenó utilizando datos de internet, entre ellos datos privados y personales. No creo que tengan superioridad moral como para decir que no puedes utilizar sus modelos para generar un set de datos.
Además, DeepSeek ha liberado técnicas de entrenamiento que antes no eran accesibles a la comunidad, aunque parece que si se conocían dentro de OpenAI. No se trata de una copia, sino de un avance que ahora otros podemos aprovechar de manera gratuita para mejorar sus propios modelos.
-Pero, no solo será DeepSeek, habrá también más empresas chinas trabajando en esto ¿no?
Sí, además de DeepSeek, hay otros actores chinos en esta carrera, como Alibaba con su modelo Qwen, que ya va por la versión 2.5. Qwen es conocido por su precisión y eficiencia, ya que no requiere hardware excesivamente potente.
La gran diferencia con DeepSeek es que Qwen no es un modelo razonador. Un modelo razonador, antes de responder, genera una "cadena de pensamiento". Por ejemplo, ante “¿cuánto es 2+2?”, en lugar de responder directamente, primero analiza: "es una operación matemática", "es una suma", "ambos sumandos son 2", "2+2 es 4". Este proceso ayuda a evitar errores y mejora la calidad de las respuestas a cambio de un mayor gasto en cálculo.
-Dicen que DeepSeek ha robado el chip más desarrollado de Nvidia y también, datos de ChatGPT.
Sobre los datos de ChatGPT, ya hemos comentado que hay indicios de que DeepSeek los usó, pero el juicio moral lo dejo a los lectores.
En cuanto a Nvidia, sus tarjetas gráficas son esenciales para entrenar modelos de IA, ya que permiten acelerar el proceso de manera significativa. Sin ir más lejos, en mi propio portátil, un modelo entrenado con esta tarjeta pasa de tardar 10 minutos a tardar 3 horas sin ella. Actualmente, Nvidia es un monopolio de facto en este sector, sin alternativas que ofrezcan el mismo rendimiento y facilidad de uso.
La guerra comercial entre EEUU y China impide que las empresas chinas accedan legalmente a los chips más avanzados de Nvidia. Sin embargo, hay indicios de que estos chips siguen llegando a China a través de mercados alternativos. Por ejemplo, el 20% de la facturación de Nvidia en 2023 provino de Singapur, un país demasiado pequeño para justificar tal consumo. Esto sugiere que, a pesar de las sanciones, los chips de última generación siguen llegando a empresas chinas, iranís o norcoreanas mediante canales no oficiales.
Quien domine la IA tendrá una ventaja competitiva enorme, ya sea en la industria, en las comunicaciones o en la defensa, ya que permite aumentar la productividad de manera muy notable
-¿Ha cruzado líneas rojas respecto a la práctica del código abierto, open sourcing, entre empresas?
En este caso, DeepSeek no ha cruzado líneas rojas en cuanto a código abierto. Es importante diferenciar entre modelo abierto y código abierto: DeepSeek no ha liberado ni su código ni sus datos de entrenamiento, solo el modelo final y un artículo detallando las técnicas usadas. Aunque estas técnicas han sido aplicadas con éxito en otros ámbitos, aún no se ha logrado replicar su modelo exactamente, y probablemente nunca se pueda sin acceso a su código y datos completos.
Sin embargo, un proyecto interesante a destacar es Open-R1, desarrollado por Hugging Face. Basándose en el artículo de DeepSeek, busca crear un modelo europeo competitivo con ChatGPT y DeepSeek, además de validar las afirmaciones del equipo chino. Este esfuerzo podría representar una alternativa más transparente dentro del ecosistema de modelos abiertos.
-He leído queal chatbot de DeepSeek le han hecho ya una auditoría de fiabilidad y que sólo consiguió un 17% de precisión a la hora de ofrecer noticias e información, y que repitió afirmaciones falsas el 30% de las veces.
No he leído ese informe, pero me parece creíble. Recientemente vi que Siri falló en 40 de 54 preguntas sobre el ganador de la Super Bowl, a pesar de tener acceso directo a internet.
Este tipo de errores no desaparecerá pronto. El problema está en la naturaleza misma de la IA: es un modelo, una representación de la realidad que, por definición, nunca será 100% precisa. Igual que una maqueta de un avión no es un avión real, un modelo de lenguaje no es conocimiento absoluto.
Es una herramienta útil que mejora la productividad, pero siempre debemos contrastar la información. Como digo siempre, no hay que creer algo solo porque lo diga un modelo, un periódico, la televisión o incluso un amigo. El espíritu crítico es clave.

-¿Es mejor DeepSeek o ChatGPT? Hablamos de las versiones que son gratis y no de las de pago, claro.
Versiones gratuitas, claramente DeepSeek. ChatGPT gratuito ni siquiera nos ofrece sus modelos razonadores, e incluso de pago ChatGPT no te da tantas consultas como DeepSeek en su plan más barato. Todo hay que decir que ChatGPT de pago tiene muchas más funciones que DeepSeek, pero a día de hoy y para la mayoría de la gente estas funciones no creo que les merezca la pena.
No digo que regular sea malo, pero actualmente Europa compite como un niño contra atletas
-Cuando salió la primera versión de ChatGPT, prometía que iba a evolucionar muy rápido, que sería mucho mejor en poco tiempo. Pero, también exigía una capacidad de cálculo brutal de los ordenadores y mucha inversión, y mucho consumo eléctrico. Esto, ¿va a cambiar a partir de ahora?
Sí, esto está cambiando. Antes, estos modelos requerían servidores con un consumo energético enorme, pero hoy en día ya puedo ejecutar una versión reducida de DeepSeek en mi portátil sin necesidad de conectarme a servidores externos. Aunque más pequeño que el modelo completo, sigue siendo muy eficaz como asistente virtual. Esto significa que la potencia necesaria para ejecutar modelos avanzados ya no es una barrera tan grande como antes.
Además, actualmente usamos hardware generalista, diseñado para múltiples tipos de tareas. Pero estamos viendo avances hacia chips especializados para modelos de lenguaje, que permitirán ejecutar estas IA con menos consumo de energía y mayor eficiencia. Esto hará que sean más accesibles y sostenibles en el largo plazo.
Otro punto clave es la integración en dispositivos físicos. Si ya podemos correr estos modelos en portátiles, pronto veremos robots y dispositivos inteligentes con IA integrada que puedan comunicarse de forma mucho más fluida y natural. Antes pensábamos que esto tardaría años en llegar, pero los avances están acelerando la adopción de esta tecnología, haciéndola más accesible para el público general y reduciendo la resistencia a su uso.
-¿Es el sector de la tecnología dónde se está librando la verdadera batalla entre las potencias del mundo?
No soy un experto en geopolítica ni mucho menos, pero la tecnología, y en particular la inteligencia artificial, se ha convertido en un factor estratégico de primer orden. Tanto a nivel económico como geopolítico, quien domine la IA tendrá una ventaja competitiva enorme, ya sea en la industria, en las comunicaciones o en la defensa, ya que permite aumentar la productividad de manera muy notable.
El problema está en la naturaleza misma de la IA: Igual que una maqueta de un avión no es un avión real, un modelo de lenguaje no es conocimiento absoluto
Todo esto redunda en una mejor economía, ser más competitivos a nivel global, y al final ser un actor más prominente en el juego geopolítico. No podría decir que solo se está dando una batalla en el sector tecnológico, pero absolutamente sí que es uno de los factores clave.
-Y, en esta guerra fría tecnológica, ¿Qué papel tiene Europa? ¿Se está quedando fuera de juego?
Europa cuenta con un ecosistema de investigación muy sólido, grandes universidades y centros punteros en IA. Sin embargo, a nivel industrial, sufre para competir con gigantes como Estados Unidos o China, sobre todo en financiación y escalabilidad de proyectos. Hay iniciativas y fondos europeos que buscan cerrar esa brecha, pero por ahora la balanza se inclina más hacia las potencias que han invertido de forma masiva y constante en IA.
Quiero hacer desde aquí un llamamiento a todo aquel que pueda tener cierta responsabilidad política y que pueda leer esta entrevista, y por favor, reactivemos el tejido industrial de Europa. Seguimos siendo un actor relevante ya que tenemos economía y empresas que proporcionan valor, pero China ya nos ha adelantado por la izquierda y cada vez más economías dejarán de depender de Europa para desarrollar sus propias industrias. En ese momento, y si no hacemos nada, Europa dejará de ser importante y nuestro querido estado del bienestar se defenestrará. Tenemos que ser otra vez aquella Europa de hace 20-30 años que llevaba los desarrollos en la industria.
-Acaba de entrar en vigor el reglamento europeo de IA que ponía límites a esta tecnología, y la UE aquí sí que ha sido pionera, ¿No? ¿Qué le parece el reglamento?
Sí, la UE ha sido pionera en regular la IA, pero lo ha hecho sin ser propietaria de la tecnología. No digo que regular sea malo, pero actualmente Europa compite como un niño contra atletas. La IA, como cualquier tecnología, puede tener usos indebidos, pero si no desarrollamos nuestros propios modelos, otros países acabarán imponiéndonos sus reglas.
No soy un experto en geopolítica ni mucho menos, pero la tecnología, y en particular la inteligencia artificial, se ha convertido en un factor estratégico de primer orden
Aquí la pregunta clave es: ¿queremos depender de modelos chinos o americanos y adaptarles normas europeas, o queremos modelos europeos que ya incorporen nuestros valores desde su diseño? En lugar de gastar millones en burocracia y agencias que regulen tecnologías extranjeras, sería más estratégico invertir en desarrollo propio.
Además, si Europa pierde relevancia, ¿realmente China o EEUU adaptarán sus modelos a nuestras regulaciones? Lo más probable es que busquen mercados con menos restricciones.
No estoy en contra de establecer reglas para evitar el mal uso de la IA, pero tener el control desde el inicio nos permitiría diseñar tecnologías alineadas con nuestros valores y reducir los riesgos sin necesidad de depender de terceros.
-Entrará en vigor por fases, ¿no es así?
Si, la primera fase ya se empezó a implementar la semana pasada. Para información de los lectores, este reglamento impone sanciones para aquellos agentes que utilicen la IA sobre todo para vigilar e influir de manera subliminal a las personas.
Sin embargo, el uso militar está exento, y los gobiernos pueden autorizar la IA con una justificación, como la lucha contra la desinformación. Esto abre la puerta a posibles abusos, permitiendo que ciertos actores utilicen IA con fines políticos mientras se imponen restricciones a otros.
Por tanto, una vez más, este reglamento lo que hace es impedir el desarrollo de pequeñas empresas ya que ahora van a necesitar implementar un gasto más en vigilar que cumple el reglamento. Las siguientes fases harán que cada vez las empresas tengan más restricciones en el uso de la IA, como por ejemplo que sean capaz de justificar las decisiones tomadas por el modelo. Esto protege al usuario, pero creo que a día de hoy es un error. Lo que deberíamos fomentar es el espíritu crítico de las personas y enseñar a detectar cuando están siendo manipulados, ya que quien quiera utilizar mal estás tecnologías no va a parar porque haya un reglamento.
¿Queremos depender de modelos chinos o americanos y adaptarles normas europeas, o queremos modelos europeos que ya incorporen nuestros valores desde su diseño?
-¿La mayor parte de las herramientas de la IA las utilizan las empresas privadas?
No, al contrario, muchas herramientas de IA están al alcance del público. Por ejemplo, los filtros de Instagram usan IA para reconocimiento facial.
Sin embargo, las aplicaciones más avanzadas sí se encuentran en empresas privadas, donde se usan para automatizar procesos y mejorar la productividad. Las instituciones públicas también están empezando a adoptar IA, y en el sector educativo ya se emplea para generar contenido didáctico y personalizar el aprendizaje.Y, sobre todo, si hablamos de inversión claramente el principal volumen sigue siendo el sector privado.

-¿La regulación está reñida con una mayor investigación en este campo concreto?
No creo que la regulación en sí impida la investigación. El problema es que los fondos están yendo a la regulación en lugar de a la investigación.
En España, investigar sigue siendo casi un "voto de pobreza", con salarios que dificultan incluso pagar un alquiler. En lugar de destinar tantos recursos a regular tecnologías extranjeras, deberíamos preguntarnos dónde invertir para impulsar realmente la innovación y garantizar que nuestros investigadores puedan desarrollar IA competitiva.
-Ya sé que la Bolsa no es su negociado, pero, ¿ha aprovechado el mercado para ajustar las valoraciones de las tecnológica, en concreto de Nvidia?
Se ha debatido mucho sobre si Nvidia estaba sobrevalorada y si la burbuja ha estallado. No es un consejo de inversión, pero Nvidia, como líder en tarjetas gráficas, ha crecido enormemente con el auge del deep learning, y cualquier cambio en la demanda de sus chips impacta su valoración.
Cuando se supo que DeepSeek entrenó su modelo con menor costo, algunos interpretaron que la necesidad de comprar chips Nvidia disminuiría, afectando su valor en Bolsa. Sin embargo, hay que distinguir entre costos de entrenamiento y de uso. Si bien DeepSeek ha optimizado el entrenamiento, eso no significa que ya no necesitemos las últimas GPUs para desarrollar modelos aún más avanzados.
Las instituciones públicas también están empezando a adoptar IA, y en el sector educativo ya se emplea para generar contenido didáctico y personalizar el aprendizaje
Además, si estos modelos se vuelven más accesibles, podría aumentar la demanda de GPUs más asequibles para uso personal, compensando la posible caída en ventas de chips de alta gama.
Lo que realmente amenazaría a Nvidia no es DeepSeek o ChatGPT, sino la aparición de chips alternativos especializados en IA, capaces de competir en calidad y precio. Hoy por hoy, esas alternativas aún no existen, y Nvidia sigue dominando el mercado.
-¿Cómo va a encajar Nvidia todo lo que está pasando?
Yo si fuera Jen-Hsun Huang (CEO de Nvidia), hubiera aprovechado para recomprar acciones cuando cayó la valoración y abrir una botella de champán por lo que he contestado antes. Dentro de poco, a menos que aparezca una empresa que no conozcamos y pueda competir directamente con sus chips, Nvidia seguirá ganando mucho dinero.
-¿Hay riesgo de burbuja?
Siempre existe el riesgo de que las expectativas inflen una burbuja. En el caso de la IA, hay proyectos con un gran potencial, pero también otros que simplemente siguen la tendencia sin un modelo de negocio real.
Si hay una burbuja, eventualmente pinchará, dejando solo a las empresas que realmente aportan valor. La clave es no invertir por moda, sino analizar si una empresa tiene un plan sólido y sostenible.
Lamentablemente, siempre habrá especuladores y quienes busquen milagros financieros, pero a largo plazo, solo sobrevivirán los proyectos bien fundamentados.
Los asistentes virtuales no solo conversarán, sino que gestionen tareas complejas en tiempo real, como reservar un restaurante mientras revisan tu agenda para optimizar tu horario y tu plan nutricional para aconsejarte qué platos del menú comer
-Por último, a partir de ahora, ¿qué?
A partir de ahora, la competencia tecnológica y geopolítica en IA seguirá intensificándose. Veremos avances en eficiencia y potencia de los modelos, así como nuevas aplicaciones en salud, educación e industria. Es un momento apasionante para la IA, pero también un reto para la sociedad, que deberá aprender a gestionarla de forma responsable.
Una de las próximas grandes innovaciones será la tecnología de agentes, donde varios modelos de IA colaboran para ofrecer respuestas más avanzadas. Esto permitirá que asistentes virtuales no solo conversen, sino que gestionen tareas complejas en tiempo real, como reservar un restaurante mientras revisan tu agenda para optimizar tu horario y tu plan nutricional para aconsejarte qué platos del menú comer. Será un paso clave para hacer la IA más útil y accesible en el día a día.