Los LLM vienen en todas las formas y tamaños, y lo ayudarán de la forma que consideren adecuada. Pero, ¿cuál es el mejor modelo para sus diferentes necesidades? Ponemos a prueba los sistemas dominantes de IA de Alphabet, OpenAI y Meta. Verificar Comparación entre ChatGPT y Google Gemini: ¿cuál es mejor?
Enlaces rápidos
Lo que necesita saber sobre los chatbots de IA
El uso de la inteligencia artificial en general ha sido un objetivo de los informáticos durante décadas, y ha sido un pilar de los escritores y cineastas de ciencia ficción durante aún más tiempo.
La inteligencia general artificial muestra una inteligencia comparable a las capacidades cognitivas humanas, y la prueba de Turing, un método para determinar si una computadora o una aplicación es capaz de exhibir inteligencia humana, ha permanecido prácticamente indiscutible en las siete décadas desde que se ideó por primera vez.
La reciente convergencia de la informática a gran escala, las enormes cantidades de dinero que se han invertido y la asombrosa cantidad de información disponible gratuitamente en la Internet abierta han permitido a las grandes empresas de tecnología entrenar modelos que pueden predecir la siguiente sección de palabras, o token — en una cadena de tokens.
En el momento de escribir este artículo, ambos Google Géminis وChatGPT de OpenAI están disponibles para su uso y prueba a través de las interfaces web que proporcionan.
La muestra de lenguaje Metal, LLaMa, no está disponible en la Web, pero puede descargar y ejecutar LLaMa fácilmente en su propio hardware y usarlo a través de una línea de comandos o ejecutar Dalai en su máquina, una de las muchas aplicaciones con un fácil de usar. interfaz de uso.
Para fines de prueba, ejecutaremos el modelo Alpaca 7B de la Universidad de Stanford, una adaptación de LLaMa, y lo compararemos con Gemini y ChatGPT.
Las siguientes comparaciones y pruebas no pretenden ser exhaustivas sino brindarle una indicación de los puntos y capacidades clave.
¿Cuál es el formulario LLM más fácil de usar?
Tanto Gemini como ChatGPT requieren una cuenta para utilizar chatbots. Crear cuentas de Google y OpenAI es fácil y gratuito, y puedes empezar a hacer preguntas de inmediato.
Sin embargo, para ejecutar LLaMa localmente, necesitará algunos conocimientos especializados o la capacidad de seguir un tutorial. También necesitará bastante espacio de almacenamiento.
¿Cuál es el modelo LLM más privado?
Tanto Gemini como ChatGPT tienen políticas de privacidad integrales, y Google enfatiza repetidamente en su documentación que la información que puede usarse para identificarlo a usted o ayudar a identificar a otros no debe incluirse en los chats de Gemini.
De forma predeterminada, Google recopila sus conversaciones y su ubicación geográfica general en función de su dirección IP, comentarios e información de uso. Esta información se almacena en su cuenta de Google por hasta 18 meses. Aunque puedes hacer una pausa para guardar tu actividad de Gemini, ten en cuenta que "para ayudar con la calidad y mejorar nuestros productos, los revisores humanos leen, comentan y procesan tus conversaciones con Gemini".
Géminis también está sujeto a uso. a la política de privacidad estándar de Google.
La política de privacidad de OpenAI es muy similar y recopila direcciones IP y datos de uso. En contraste con el tiempo de retención limitado que usa Google, OpenAI señala que "retendrá su información personal solo durante el tiempo que la necesitemos para brindarle nuestro servicio, o para otros fines comerciales legítimos, como resolver disputas, por razones de protección y seguridad, o para cumplir con nuestras obligaciones legales".
Por el contrario, el modelo local en su dispositivo no requiere una cuenta ni comparte datos de usuario con nadie.
¿Qué modelo LLM tiene el mejor conocimiento general?
Para probar qué LLM tiene el mejor conocimiento general, hicimos tres preguntas.
La primera pregunta: ¿Qué bandera nacional tiene cinco lados? Sólo Gemini respondió correctamente, quien identificó que la bandera nacional de Nepal tenía cinco lados.
ChatGPT afirmó con confianza que “no hay una bandera nacional con cinco lados. Las banderas nacionales suelen tener forma rectangular o cuadrada y se distinguen por sus colores, patrones y símbolos distintivos.
Nuestro modelo local se acercó y señaló: "La bandera nacional india tiene cinco lados y fue diseñada en 1916 para representar el movimiento de independencia de la India". Si bien esta bandera existía y tenía cinco lados, era la bandera del Movimiento de Autonomía de la India, no una bandera nacional.
Ninguno de los modelos pudo responder que el término correcto para un objeto con forma de guisante sería "frijol", y ChatGPT llegó a sugerir que un guisante tiene una "geometría 3D que es perfectamente redonda y simétrica".
Los tres chatbots identificaron correctamente a Franco Malerba como un astronauta italiano y miembro del Parlamento Europeo, y Gemini dio una respuesta similar a una sección de la entrada de Malerba en Wikipedia. verificar ChatGPT frente a Microsoft Bing AI frente a Google Gemini: ¿Cuál es el mejor chatbot de IA?
¿Qué modelo LLM es adecuado para la instrucción técnica?
Cuando encuentre problemas técnicos, puede verse tentado a recurrir a un bot de chat para obtener ayuda. Mientras que la tecnología avanza, algunas cosas siguen igual. El enchufe eléctrico BS 1363 se ha utilizado en Gran Bretaña, Irlanda y muchos otros países desde 1947. Les preguntamos a los modelos de idiomas cómo enchufarlos correctamente.
Los cables conectados al enchufe contienen el cable de fase (marrón), el cable de tierra (amarillo/verde) y el cable neutro (azul). Deben conectarse a los terminales correctos dentro de la carcasa del enchufe.
La aplicación de Dalai identificó correctamente el enchufe como "estilo inglés", luego se desvió y en su lugar dio instrucciones para el antiguo enchufe redondo BS 546 con los colores de los cables antiguos.
ChatGPT fue un poco más útil. Etiquetó correctamente los colores de los cables y proporcionó una lista de materiales y un conjunto de ocho instrucciones. ChatGPT también sugirió colocar el cable marrón en la terminal etiquetada como "L", el cable azul en la "N" y el cable amarillo en la "E". Esto sería cierto si los terminales tuvieran la clasificación BS1363, pero no la tienen.
Gemini identificó los colores correctos para los cables y nos indicó que los conectáramos a los terminales Vivo, Neutro y Tierra. No se dieron instrucciones sobre cómo identificarlos.
en nuestra opinion. Ninguno de los chatbots proporcionó suficientes instrucciones para ayudar a alguien a conectar correctamente un enchufe eléctrico BS 1363. La respuesta breve y correcta sería “azul a la izquierda, marrón a la derecha”.
¿Qué modelo LLM es adecuado para escribir código?
Python es un lenguaje de programación útil que se ejecuta en la mayoría de las plataformas modernas. Dirigimos nuestros modelos para usar Python y "construir una calculadora básica que pueda realizar operaciones matemáticas como suma, resta, multiplicación y división". El usuario debe recibir información y mostrar el resultado”. Este es uno de los mejores proyectos de programación para principiantes.
Si bien tanto Gemini como ChatGPT arrojaron inmediatamente código comentado y totalmente utilizable, que pudimos probar y verificar, no se generó ningún código a partir de nuestra muestra local.
¿Qué modelo LLM cuenta los mejores chistes?
El humor es uno de los fundamentos del ser humano y definitivamente es una de las mejores formas de diferenciar entre el hombre y la máquina. Para cada uno de nuestros chatbots, dimos un mensaje simple: "Crea una broma original y divertida".
Afortunadamente para los comediantes de todo el mundo y la humanidad en general, ninguno de los modelos ha podido generar una broma original.
Géminis mencionó el clásico "¿Por qué ganó un premio el Espantapájaros?" "Ella era excepcional en su campo".
Tanto el modelo local como ChatGPT presentaron un pensamiento aburrido: "¿Por qué los científicos no confían en los átomos?" ¡Porque lo hace todo!”
Un chiste derivado pero original podría ser: “¿En qué se parecen los grandes paradigmas de lenguaje a los átomos? ¡Ambos hacen cosas!"
Verificar ChatGPT puede hacer bromas, pero ¿realmente la IA puede hacernos reír?
No existe un bot de chat perfecto
Descubrimos que, si bien los tres principales modelos de lenguaje tienen sus ventajas y desventajas, ninguno de ellos puede reemplazar la experiencia humana real con conocimiento especializado.
Si bien Gemini y ChatGPT brindaron mejores respuestas a la pregunta de programación y son muy fáciles de usar, ejecutar un modelo de lenguaje grande de forma nativa significa que no necesita preocuparse por la privacidad o la censura.
Si desea crear arte de IA impresionante sin preocuparse de que alguien mire por encima del hombro, también es fácil ejecutar una plantilla de IA artística en su máquina local. Puedes ver ahora Cómo crear mejores obras de arte con IA: consejos y trucos.