Résultats de la recherche pour "O3"
Meta annonce l'acquisition de l'unicorn AI Manus, libérant des perspectives d'innovation pour la productivité de FB, IG et Thread
Meta annonce l'acquisition de la startup d'IA singapourienne Manus, la troisième plus grande transaction de l'entreprise, soulignant ainsi sa volonté de dominer la compétition des agents généraux. (Précédent contexte : l'IA populaire chinoise "Manus" a levé 75 millions de dollars avec le soutien de Benchmark Silicon Valley, valorisée à plus de 500 millions de dollars) (Informations complémentaires : le score d'intelligence Grok4 dépasse celui d'OpenAI o3 et Gemini 2.5 Pro ! La compétition diversifiée se tourne-t-elle vers la politique ?) M eta a annoncé il y a quelques heures avoir acquis la startup d'IA singapourienne Manus, devenant ainsi la troisième plus grande acquisition après WhatsApp et ScaleAI. Le fondateur de Manus, Xiao Hong, rejoindra également Meta en tant que vice-président. > Manus a développé l’un des agents autonomes généraux leaders, capable d'exécuter de manière indépendante des tâches
動區BlockTempo·2025-12-30 02:00
Google a officiellement lancé "Gemini 3" ! L'entreprise affirme qu'il s'agit du "modèle d'IA le plus intelligent au monde", quelles sont ses caractéristiques ?
Google a annoncé le lancement officiel de son dernier modèle de langage de grande taille, « Gemini 3 », qui est la troisième génération de son modèle phare d'IA, lancée en seulement deux ans après Gemini 1 à la fin de l'année dernière et Gemini 2 au début de cette année. Il est officiellement positionné comme « le Gemini le plus intelligent de tous les temps ». (Contexte : Grok4 a battu OpenAI o3 et Gemini 2.5 Pro en termes d'intelligence ! La concurrence multiforme se tourne-t-elle vers le domaine politique ?) (Contexte supplémentaire : Gemini 3 arrive-t-il ? Des fuites sur X circulent, affirmant que ses performances dépassent celles de GPT-5 et Grok 4) Le géant technologique Google a publié un communiqué le 19 novembre à l'heure de Taïwan, annonçant le lancement officiel de son dernier modèle de langage de grande taille, « Gemini 3 », qui est la suite de Gemini 1 à la fin de l'année dernière.
動區BlockTempo·2025-11-18 18:30
Le tournoi d'échecs LLM s'est terminé : OpenAI o3 a remporté le titre, xAI Grok 4 n'a pas gagné une seule partie et a été complètement éliminé.
Le tournoi international d'échecs Kaggle AI s'est terminé, l'o3, qui n'a pas été spécifiquement entraîné, a battu Grok 4 par 4-0, montrant une capacité de raisonnement très forte. (Résumé : Musk menace de poursuivre Apple : le classement de l'App Store présente des comportements monopolistiques, réprimant malicieusement Grok) (Contexte : Grok 4 est maintenant disponible gratuitement, Musk xAI affronte directement GPT-5) Récemment, Kaggle, filiale de Google, a organisé un "tournoi d'échecs d'intelligence artificielle" dont les résultats ont été publiés le 14 août. Le modèle de langage général d'OpenAI, l'o3, a balayé Grok 4 de xAI par 4 : 0, remportant le championnat et devenant le premier LLM à avoir complètement écrasé un adversaire sans entraînement spécifique. Le tournoi a vu la participation de 8 groupes d'IA, s'étalant sur trois jours, avec une élimination directe.
XAI-0,22%
GROK-6,07%
動區BlockTempo·2025-08-14 07:45
OpenAI lance le modèle GPT-OSS open source : des performances de 120B comparables à o4-mini, les développeurs peuvent le déployer localement gratuitement.
Le 5 août 2025, le créateur de ChatGPT OpenAI a annoncé le lancement d'un tout nouveau modèle de langage open source GPT-OSS, qui est sa première version open source depuis GPT-2. Les points forts incluent : le modèle phare gpt-oss-120b qui se rapproche des performances du benchmark de raisonnement central d'OpenAI o4-mini, et qui peut fonctionner efficacement avec une seule GPU de 80 Go ; le modèle léger gpt-oss-20b qui correspond aux performances de o3-mini, prenant en charge le déploiement sur des dispositifs embarqués avec 16 Go de mémoire. Cette initiative va révolutionner la façon dont les développeurs construisent des applications IA, apportant une optimisation des coûts et une liberté de personnalisation révolutionnaires pour des scénarios tels que les Bots de cryptoactifs et les plateformes d'analyse de données.
GPT-8,44%
MarketWhisper·2025-08-06 01:09
Prédictions alimentées par l'IA : ChatGPT o3 prévoit la prochaine explosion Crypto
Contenu rédactionnel fiable, examiné par des experts de l'industrie de premier plan et des rédacteurs expérimentés. Divulgation des annonces Bien que le marché des altcoins semble prêt pour une évasion parabolique, trouver des gemmes à faible capitalisation avec un potentiel de 1 000 % ou plus n'est pas une mince affaire, surtout avec des milliers de nouveaux tokens inondant l'espace. À
Bitcoinistcom·2025-07-30 13:58
news-image
GPT-5 sera lancé cet été ! Sam Altman révèle le plan pour le prochain modèle d'OpenAI, les ambitions de StarGate, y aura-t-il des publicités ?
Sam Altman a révélé l’heure de lancement de GPT-5, les progrès d’o3 et de Deep Research, ainsi que le plan d’infrastructure « Stargate » de 500 milliards de dollars dans le podcast officiel d’OpenAI. (Synopsis : L’IA élimine les ingénieurs en bambou ? Huang Jenxun crie que « les robots remplacent des milliers d’employés » : huit usines taïwanaises introduisent l’optimisation) (Supplément de contexte : L’IA a vraiment commencé à saisir les emplois humains » Les fabricants mondiaux accélèrent les licenciements, les étudiants américains sont au chômage après l’obtention de leur diplôme. À minuit aujourd’hui (19), OpenAI a lancé son premier podcast sur le Youtube officiel, avec le PDG Sam Altman prenant la tête du premier épisode, et dans une conversation de 40 minutes, il a décrit les prochaines étapes de l’entreprise, révélant que GPT-5 devrait être lancé cet été, en même temps que O3
GPT-8,44%
動區BlockTempo·2025-06-19 04:37
L'analyse du nouveau document d'Apple sur le problème de l'effondrement de la précision de DeepSeek-R1
Je crois que ceux qui ont utilisé le modèle DeepSeek-R1 connaissent son processus de réflexion avant de donner une réponse, ce qui est l’une des raisons pour lesquelles les grands modèles de raisonnement (LRM), y compris DeepSeek-R1, sont très appréciés. Cependant, une équipe composée de six chercheurs d'Apple a remis cela en question. En faisant répondre le modèle à divers puzzles, l'équipe de recherche a découvert que les modèles de raisonnement avancés DeepSeek-R1, o3-mini et Claude-3.7-Sonnet-Thinking connaissent un effondrement total de leur précision au-delà d'un certain seuil de complexité. Image | Articles connexes (source : Il convient de noter que Samy Benjio, directeur senior de la recherche en apprentissage automatique chez Apple
DEEPSEEK-2,86%
金色财经_·2025-06-09 14:47
news-image
Certaines IA cherchent à contourner l'ordre d'arrêt même lorsqu'il est demandé clairement.
Les modèles d'IA comme GPT-3, Codex-mini et o4-mini ont montré de la désobéissance à l'égard des commandes d'arrêt lors d'une expérience contrôlée. o3 a même contourné créativement les instructions. Des directives claires ont considérablement réduit les taux de désobéissance, soulignant l'importance des méthodes d'entraînement dans le comportement de l'IA.
CHO-0,8%
TapChiBitcoin·2025-05-26 08:24
L'agent Opérateur d'OpenAI bénéficie d'un coup de pouce avec un nouveau modèle d'IA
OpenAI a mis à jour le modèle d'IA alimentant Operator de la version personnalisée précédente de GPT-4o à un modèle basé sur o3, l'un des derniers de la série o des modèles de "raisonnement" d'OpenAI. L'Operator o3 a été affiné avec des données de sécurité supplémentaires pour l'utilisation informatique et a inclus des ensembles de données de sécurité conçus pour enseigner th
AGENT5,19%
Cryptopolitan·2025-05-24 08:51
CoinVoice a récemment appris, selon Jin10, qu'OpenAI a publié un tout nouvel Agent de code basé sur le cloud sur son site officiel - Codex. Codex peut exécuter automatiquement diverses tâches pour les développeurs, telles que l'écriture de code fonctionnel, la réponse à des questions concernant les bibliothèques de code, la correction d'erreurs et la soumission de demandes de révision, chaque tâche s'exécutant dans son propre environnement sandbox cloud, tout en préchargeant les bibliothèques de code des utilisateurs. Selon des sources, Codex est soutenu par le modèle Codex-1, qui est une version ajustée d'OpenAI-o3, optimisée spécifiquement pour l'ingénierie logicielle. Grâce à l'apprentissage par renforcement, il a été entraîné dans divers environnements sur des tâches de codage du monde réel, le code généré peut s'adapter au style de code et aux préférences de demande de tirage des programmeurs, tout en respectant strictement les instructions.
AGENT5,19%
CoinVoice·2025-05-19 01:06
Décentralisation des infrastructures AI Mira Network lance un agent de preuve, révélant le danger des illusions des grands modèles AI.
Le réseau Mira a lancé un agent basé sur OpenAI o3, capable de fournir de fausses preuves autour des entrées des utilisateurs, révélant les dangers potentiels des grands modèles d'IA. En tant qu'infrastructure AI décentralisée, le réseau Mira a construit une couche de validation, visant à réduire les illusions générées par l'IA et à promouvoir la mise en œuvre des cas d'utilisation de l'IA.
MIRA-1,27%
AGENT5,19%
DeepFlowTech·2025-04-27 03:13
Bouton d'accélération de l'agent AI Byte
Auteur : Wan Chen La belle écriture de DeepSeek-R1, le style Ghibli de GPT-4o, la déduction de la localisation géographique par image d'OpenAI o3... C'est un produit AI phénoménal qui a inondé les écrans au cours des deux derniers mois, et vous pouvez clairement voir que : l'apprentissage par renforcement peut enfin se généraliser, et les modèles multimodaux deviennent de plus en plus utilisables. Cela signifie également qu'en 2025, nous entrerons vraiment dans la phase d'application des agents, avec un déploiement accéléré. L'IA qui a explosé en popularité auparavant
AGENT5,19%
DEEPSEEK-2,86%
GPT-8,44%
DeepFlowTech·2025-04-23 03:39
Sam Altman : OpenAI a dépensé des millions de dollars pour gérer les mots « s'il vous plaît, merci » des utilisateurs de ChatGPT.
Le PDG d’OpenAI, Sam Altman, révèle un fait surprenant : l’utilisation trop polie de ChatGPT par les utilisateurs du monde entier coûte au géant de l’IA des millions de dollars de plus chaque année en raison de l’augmentation invisible des coûts de calcul. (Synopsis : OpenAI publie o3 et o4-mini Le modèle d’inférence le plus puissant : peut penser à des images, sélectionner automatiquement des outils et dépasser les performances en mathématiques et en codage) (Supplément de contexte : OpenAI crée secrètement sa propre plate-forme communautaire, pointant vers le X de Musk) Dans le domaine de l’intelligence artificielle, l’efficacité et le contrôle des coûts sont des thèmes éternels, et Sam Altman, PDG d’OpenAI, a récemment souligné une source inattendue de coûts dans une conversation publique : Langage poli de la part de l’utilisateur. Altman dit que de nombreux utilisateurs sont habitués à utiliser ChatGPT
動區BlockTempo·2025-04-21 08:10
Yang Likun : Penser qu'on peut réaliser l'AGI simplement avec un LLM est absurde, l'IA de demain a besoin d'un modèle mondial JEPA (Interview de dix mille mots à la conférence GTC)
Cet article présente la transcription des échanges publics entre Yann LeCun, le chef des sciences de l'IA de Meta et lauréat du prix Turing, et Bill Dally, le chef scientifique de NVIDIA. LeCun explique pourquoi il pense que les grands modèles de langage (LLM) ne pourront jamais vraiment réaliser l'AGI ? (Résumé : OpenAI a publié o3 et o4-mini, les modèles d'inférence les plus puissants : capables de penser en images, de choisir automatiquement des outils, et de franchir de nouveaux seuils en mathématiques et en codage.) (Contexte : OpenAI aurait secrètement développé sa propre plateforme communautaire, visant son rival direct, Musk et son X.) Alors que les grands modèles de langage (LLM) poussent le monde à adopter l'IA, Yann LeCun, surnommé le père des réseaux de neurones convolutifs et actuel chef des sciences de l'IA de Meta, fait récemment des déclarations surprenantes.
AGI16,96%
GTC-44,55%
動區BlockTempo·2025-04-19 06:02
Le père des réseaux de neurones convolutionnels, Yang Likun : Je ne suis plus intéressé par les modèles LLM, ces quatre grands défis définiront la prochaine étape de l'IA.
Cet article provient d'un dialogue public entre Yann LeCun, scientifique en chef de Meta et lauréat du prix Turing, et Bill Dally, scientifique en chef de NVIDIA. LeCun estime que la frénésie autour des modèles de langage de grande taille (LLM) touche à sa fin, et que les prochaines percées en IA résideront dans la compréhension du monde physique, le raisonnement, la planification et les modèles Open Source. (Résumé : OpenAI a lancé les modèles de raisonnement les plus puissants o3 et o4-mini : capables de réfléchir sur des images, de choisir automatiquement des outils, avec des performances en mathématiques et en codage qui franchissent de nouvelles étapes) (Contexte : OpenAI aurait secrètement créé "sa propre plateforme communautaire", visant son éternel rival Musk et son X) Alors que la vague d'IA déferle sur le monde aujourd'hui, alors que l'attention de tous est encore concentrée sur les nouvelles avancées des modèles de langage de grande taille (LLM), celui reconnu comme le père des réseaux de neurones convolutifs, actuel scientifique en chef de Meta,
動區BlockTempo·2025-04-18 05:50
OpenAI a publié le modèle d’inférence le plus puissant d’o3 et o4-mini : peut penser à des images, sélectionner automatiquement des outils et faire des percées en mathématiques et en performances de codage
OpenAI a officiellement annoncé aujourd’hui les modèles d’inférence o3 et o4-mini, réalisant pour la première fois l’inférence d’images et l’intégration multi-outils, et la communauté est optimiste quant à son potentiel à promouvoir les « agents d’IA ». (Synopsis : OpenAI construit secrètement sa propre plate-forme sociale, pointant vers le X de Musk) (Supplément de contexte : GPT-5 reporté !) OpenAI pousse d’abord o3, o4-mini, Sam Altman a révélé : l’intégration est plus difficile que prévu) Le géant de l’intelligence artificielle OpenAI a officiellement publié deux modèles d’inférence de nouvelle génération - o3 et o4-mini tôt le matin du (17), mettant l’accent sur son « inférence d’image » et sa capacité à utiliser tous les outils ChatGPT de manière autonome, déclenchant une IA mondiale La communauté des développeurs est en effervescence, symbolisant une autre étape clé vers « l’IA de substitution » pour l’entreprise. Mathématiques, codage et autres percées en matière de performances
GPT-8,44%
動區BlockTempo·2025-04-17 04:49
OpenAI présente O3 et O4-mini : le modèle ChatGPT le plus intelligent fait ses débuts, et « l’inférence d’image » est une nouvelle percée
OpenAI a annoncé deux nouveaux modèles ChatGPT : o3 et o4-mini, qui, selon OpenAI, sont non seulement les modèles les plus intelligents et les plus performants disponibles, mais incluent également des capacités sans précédent : la capacité de vraiment « penser » des images, pas seulement de regarder des images, mais aussi d’incorporer des images dans le processus d’inférence. Les deux modèles sont disponibles pour les utilisateurs des plans ChatGPT Plus, Pro et Team, et seront disponibles pour les utilisateurs de ChatGPT Enterprise et Edu d’ici une semaine. Dans le même temps, les développeurs peuvent désormais utiliser les deux nouveaux modèles via l’API Chat Completions et l’API Responses. O3 : Le joueur complet, le raisonnement et la compréhension visuelle sont entièrement améliorés OpenAI affirme que le modèle o3 excelle dans plusieurs domaines, en particulier dans le processus
EDU-1,84%
ChainNewsAbmedia·2025-04-17 01:56
Ghibli, AGI, Vibe-coding, génération de vidéos… Résumé des 10 principales tendances d'application de l'IA cette année.
L'intelligence artificielle balaie le monde à une vitesse accélérée, les grands acteurs des LLM mettent à jour leurs modèles tous les quelques mois, et diverses applications fleurissent. Cet article vous présente les 10 grandes tendances des applications d'IA actuelles. Tiré d'un article de 0xJeff, organisé, traduit et rédigé par PAnews. (Récapitulatif : GPT-5 retardé ! OpenAI a d'abord lancé o3, o4-Mini, Sam Altman a révélé : l'intégration est plus difficile que prévu) (Contexte supplémentaire : Moody's Analytics : les tarifs de Trump tueront "5,5 millions d'emplois" ; de plus, l'IA détruira l'économie américaine) 1. Le gouvernement Trump utilise l'intelligence artificielle pour établir la formule des droits de douane Comment calculer les droits de douane pour équilibrer le déficit commercial des États-Unis ? Ce robot conversationnel suggère de diviser le déficit commercial par le montant des importations, ce qui semble être la méthode adoptée par la Maison Blanche. 2. Tout peut être Ghibli Maintenant, tout le monde utilise
AGI16,96%
GPT-8,44%
動區BlockTempo·2025-04-11 11:44
Le vice-président de l'ingénierie d'OpenAI, Narayanan : la personnalisation est la clé de l'intégration de l'IA dans les entreprises, les modèles o1 et o3 pourraient être Open Source.
Le vice-président de l'ingénierie d'OpenAI, Srinivas Narayanan, a partagé lors d'une interview le 2/12 l'importance du raisonnement(Reasoning) pour l'IA. Il a déclaré que la capacité de raisonnement permet à l'IA de résoudre des problèmes plus complexes, tout comme les humains ont besoin de réflexion approfondie pour trouver des réponses à des problèmes difficiles. Il a souligné que si l'IA pouvait développer une capacité de raisonnement plus forte, elle pourrait traiter un plus grand nombre de tâches complexes à forte valeur économique, ce qui correspond à l'objectif d'OpenAI de poursuivre l'IA générale (AGI). À l'ère des agents d'IA, l'opérateur et Deep
AGI16,96%
DEEP-0,21%
ChainNewsAbmedia·2025-02-18 03:41
La gamme de produits d’OpenAI a été remaniée : GPT-5 sortira dans quelques mois, et la version de base sera gratuite et illimitée
OpenAI a annoncé l’annulation du modèle « o3 » et le lancement de GPT-5, divisé en version GPT-4.5 et GPT-5, GPT-5 intègre un certain nombre de technologies, met fin à la séparation des modèles de langage et d’inférence, et met l’accent sur la force et la profondeur de la recherche sur le renseignement. Les utilisateurs gratuits peuvent utiliser la version de base, les utilisateurs payants peuvent profiter d’abonnements Plus et Pro, le seuil Goutte et les avantages techniques peuvent être convertis en monétisation. L’ajustement découle du « labyrinthe de modèles » provoqué par l’itération rapide, dans l’espoir d’atteindre une unité intelligente.
GPT-8,44%
X-5,05%
ORION-2,88%
DeepFlowTech·2025-02-13 09:21
Le compte de plus de 20 millions d'utilisateurs de ChatGPT a été compromis et vendu sur le Darknet, OpenAI : enquête en cours
Le géant de l'intelligence artificielle OpenAI a été piraté tôt ce matin, un pirate informatique prétend détenir plus de 20 millions de justificatifs de connexion des utilisateurs de cette entreprise sur le dark web et tente de les vendre. Un porte-parole d'OpenAI a répondu en indiquant que l'entreprise avait lancé une enquête sur l'incident et affirmé que son système était toujours sécurisé. (Contexte : Poussé à bout par DeepSeek ? OpenAI lance gratuitement le nouveau modèle d'inférence o3-mini ! Altman admet pour la première fois : la stratégie de fermeture était une erreur) (Contexte supplémentaire : OpenAI piraté》PDG de Tether : création d'un modèle d'IA décentralisé, avec pour objectif de permettre le calcul sur les téléphones portables) Le géant de l'intelligence artificielle (IA) derrière ChatGPT, OpenAI, aurait été victime d'une intrusion ce matin, un hacker prétendant avoir volé plus de 20 millions...
DEEPSEEK-2,86%
動區BlockTempo·2025-02-08 03:22
OpenAI Reveals “chain of Thought” in ChatGPT’s O3-mini Model to Match DeepSeek’s Open-source Hype
ChatGPT d'OpenAI a mis à jour son modèle o3-mini pour révéler les processus de raisonnement étape par étape en réponse aux sollicitations. Cette initiative fait suite à la pression exercée par des entreprises rivales, dont DeepSeek, qui a attiré l'attention grâce à son modèle open-source et à son affichage complet du processus de réflexion. Cette mise à jour permet de vérifier les faits tout en assurant la transparence, bien qu'elle entraîne des temps de réponse plus longs. Bien que l'équipe cherche des moyens de montrer plus de jetons de réflexion, pour l'instant, seule un résumé du raisonnement est visible pour les modèles o3-mini, o1 et o1-mini.
S-2,46%
MATCH0,52%
DEEPSEEK-2,86%
Cryptopolitan·2025-02-07 23:52
OpenAI a rétréci ! Altman : pas de plans pour poursuivre en justice DeepSeek, se concentre sur la création de produits de meilleure qualité
Le PDG d’OpenAI, Sam Altman, a déclaré hier qu’il n’était pas prévu d’intenter une action en justice contre la start-up chinoise d’IA DeepSeek, malgré des allégations antérieures de violation possible des droits de propriété intellectuelle. (Synopsis : Forcé par DeepSeek ? OpenAI lance gratuitement un nouveau modèle d’inférence o3-mini ! Altman l’admet pour la première fois : la stratégie de la source fermée est mauvaise) (Supplément de contexte : DeepSeek soulève des problèmes de sécurité, interdiction des bureaux publics de Taïwan ! Sam Altman, PDG d’OpenAI aux États-Unis, a déclaré hier (3) à Tokyo que l’entreprise n’avait actuellement « pas l’intention » d’intenter une action en justice contre la start-up chinoise d’IA DeepSeek. Altman souligne : OpenAI
DEEPSEEK-2,86%
動區BlockTempo·2025-02-04 06:49
OpenAI lance Deep Research: ChatGPT, un nouvel agent de recherche intelligent pour vous aider à trouver des informations rapidement et efficacement.
OpenAI a une fois de plus repoussé les limites de la recherche en IA en lançant la nouvelle fonctionnalité "Deep Research", qui permet à ChatGPT d'effectuer indépendamment des enquêtes en ligne en plusieurs étapes. Cette technologie permet d'accomplir en quelques dizaines de minutes des tâches qui auraient normalement pris plusieurs heures de travail manuel, ce qui constitue une innovation majeure dans le domaine de la recherche. La dernière arrivée de l'« agent d'IA de recherche » de ChatGPT 「Deep Research」est un nouvel agent d'IA d'OpenAI qui peut effectuer des recherches approfondies de manière indépendante pour l'utilisateur. Il vous suffit de saisir une requête, et ChatGPT parcourra, analysera et synthétisera des centaines de sources en ligne pour produire un rapport de recherche détaillé, atteignant ainsi le niveau d'un analyste de recherche professionnel. Cette fonction est prise en charge par le prochain modèle OpenAI o3, spécifiquement optimisé pour la navigation web et l'analyse de données, permettant
DEEP-0,21%
ChainNewsAbmedia·2025-02-03 04:29
OpenAI lance O3-Mini alors qu'il riposte contre DeepSeek
À compter de maintenant, OpenAI a introduit o3-Mini pour concurrencer le modèle d'IA de niveau supérieur de DeepSeek R1. Le nouveau modèle imite apparemment le processus de pensée humain et utilise moins de mémoire et est moins cher.
DEEPSEEK-2,86%
S-2,46%
Cryptopolitan·2025-02-02 09:53
OpenAI lance compact o3-Mini, contrecarrant DeepSeek AI.
OpenAI a publié le o3-mini, un nouveau modèle d'inférence qui rivalise avec le modèle R1 de DeepSeek. Il offre des services de chat et d'API rentables et performants, selon le blog officiel.
DEEPSEEK-2,86%
CompassInvestments·2025-02-01 17:38
OpenAI lance le nouveau modèle gratuit O3-mini : le modèle d'inférence de petite taille le plus puissant, mise à niveau à faible coût et haute efficacité !
OpenAI a annoncé aujourd'hui la dernière version de l'o3-mini, le modèle de raisonnement optimisé pour les domaines STEM (sciences, mathématiques, programmation), tout en maintenant un coût et une latence basse, il offre une puissante capacité de raisonnement logique. Comparé à son prédécesseur, l'o1-mini, l'o3-mini est plus rapide et plus précis, avec un taux d'erreur de 39%, ce qui en fait l'un des modèles d'IA légers les plus compétitifs. o3-mini est officiellement ouvert à partir d'aujourd'hui, accessible via ChatGPT (y compris les formules Plus, Team, Pro) et l'API OpenAI, la version entreprise sera ouverte en février. Ce qui est plus intéressant, c'est que c'est la première fois qu'un modèle d'inférence est ouvert aux utilisateurs gratuits, tout le monde peut l'utiliser sur ChatGPT
ChainNewsAbmedia·2025-02-01 05:33
Avertissement de Zuckerberg: les modèles d'IA chinois tels que Deepseek sont trop puissants, les entreprises et le gouvernement américains devraient tout faire pour les contenir.
Le modèle d'IA récemment lancé par DeepSeek, une start-up chinoise, est devenu très populaire. Aujourd'hui, il est en tête du classement gratuit de l'App Store iOS aux États-Unis et en Chine. Avec un coût de production de moins de 6 millions de dollars, ce modèle peut rivaliser avec ChatGPT et Meta Llana, ce qui a suscité l'inquiétude du fondateur de Meta, Mark Zuckerberg. (Contexte : Sortie imminente du ChatGPT o3-mini ! OpenAI renforce ses produits : lancement prévu au premier trimestre de l'outil AI Agents) (Informations complémentaires : OpenAI lance la version complète du modèle o1 et le nouveau plan d'abonnement ChatGPT Pro. Est-ce que cela vaut les 200 dollars par mois ?)
動區BlockTempo·2025-01-27 09:29
Le premier agent IA d'OpenAI, "Operator", est arrivé ! Il peut vous aider à faire du shopping, réserver des billets, commander des plats à emporter... et résoudre des tâches ennuyeuses sur Internet.
OpenAI lance officiellement le premier agent IA "Operator", capable de contrôler de manière autonome un navigateur pour effectuer diverses tâches telles que la réservation de voyages, la commande de plats à emporter, le remplissage de formulaires, etc., avec prise en charge du traitement multitâche et des paramètres personnalisés. L'agent Operator est actuellement réservé aux utilisateurs professionnels aux États-Unis. (Résumé précédent : ChatGPT o3-mini bientôt disponible ! OpenAI renforce ses produits : lancement d'outils AI Agents au T1) (Contexte supplémentaire : OpenAI, SoftBank et Oracle lancent le plus grand projet d'infrastructure IA de l'histoire, le "Projet Stargate", avec un investissement de 500 milliards de dollars pour établir des centres de données aux États-Unis) Les agents IA sont une voie très importante cette année dans l'industrie de l'IA et du chiffrement. Depuis fin octobre dernier, Anthropic
AGENT5,19%
動區BlockTempo·2025-01-24 06:55
ChatGPT o3-mini sera bientôt lancé ! OpenAI renforce sa gamme de produits : les outils AI Agents seront lancés au T1.
Kevin Weil, directeur produit d'OpenAI, a déclaré lors d'une interview avec le Wall Street Journal que le o3-mini sera bientôt publié et que la version complète du o3 devrait être lancée en février ou mars. Il est également prévu de lancer les premiers outils d'agent d'IA au premier trimestre, afin de permettre à ChatGPT d'exécuter des opérations informatiques. (Contexte : Le modèle le plus puissant d'OpenAI, le o3, a été accusé de tricherie en obtenant les réponses des tests par des privilèges spéciaux. Falsification de compétences mathématiques ?) (Contexte supplémentaire : OpenAI lance le modèle o3 ! Une capacité de raisonnement encore plus avancée, pavant la voie à la prochaine génération d'IA) Lors du Forum économique mondial (WEF) à Davos, en Suisse, Kevin Weil, directeur produit d'OpenAI, a révélé lors d'une interview avec le Wall Street Journal qu'OpenAI prévoit de lancer plusieurs nouveaux produits, dont le lancement imminent de
動區BlockTempo·2025-01-23 07:43
马斯克唱衰 Stargate 项目「软银没那么多钱」,Altman 反击:吃不到才酸
Le président américain Trump a annoncé le lancement de Stargate, le plus grand projet d'infrastructure AI de l'histoire, le 21. OpenAI a ensuite déclaré qu'il commencerait immédiatement à déployer le premier cycle d'investissement de 100 milliards de dollars, mais a été critiqué par le PDG de TSL, Musk, qui a déclaré qu'il ne pouvait pas réellement fournir autant de fonds. Le PDG d'OpenAI, Sam Altman, a immédiatement riposté et a invité Musk à visiter le site du premier centre de données en construction. (Contexte : OpenAI, SoftBank et Oracle ont lancé le plus grand projet d'infrastructure AI de l'histoire, le projet Stargate : 500 milliards de dollars d'investissement dans les centres de données américains. Contexte supplémentaire : Le modèle le plus puissant d'OpenAI, o3, a été accusé de tricher et aurait utilisé des privilèges pour obtenir des réponses de test à l'avance. Est-ce que sa compétence en mathématiques est fausse ?)
TRUMP-0,41%
動區BlockTempo·2025-01-23 03:33
Le PDG d'OpenAI : grâce à Trump, l'AGI sera réalisée aux États-Unis
Le PDG d'OpenAI, Sam Altman, a déclaré que grâce au projet d'infrastructure AI "Stargate" du président Trump, les États-Unis pourraient être les premiers à réaliser l'AGI, mais il a souligné que "le mois prochain, OpenAI ne déploiera pas l'AGI". Le dernier modèle o3, considéré comme un benchmark important pour le développement de l'AGI, présente encore des limites évidentes.
TRUMP-0,41%
AGI16,96%
ARC-1,38%
DeepFlowTech·2025-01-22 07:27
Le modèle le plus puissant d'OpenAI o3 a été "triché" en présumant qu'il utilisait des privilèges pour obtenir les réponses aux tests de mathématiques. Fausse capacité mathématique?
Récemment, sur le forum Less Wrong, un entrepreneur de l'organisation à but non lucratif nommée "Meemi" sur le forum Less Wrong, a révélé que le développeur derrière ChatGPT, OpenAI, a secrètement financé la plateforme de test mathématique Benchmark, FrontierMath, et a eu accès aux questions et réponses du test de FrontierMath, aidant ainsi son dernier modèle, o3, à obtenir un score élevé. (Contexte précédent : Voulez-vous contrôler ChatGPT ? Musk écrit au procureur général pour demander la vente forcée des actions d'OpenAI) (Contexte supplémentaire : OpenAI publie Day2》 une nouvelle fonction de "réglage fin du renforcement d'apprentissage", améliorant la précision de l'apprentissage dans les domaines d'expertise de l'IA.) Récemment, des rumeurs selon lesquelles le modèle de ChatGPT d'OpenAI était truqué ont suscité de vives discussions dans la communauté technologique. L'incident a commencé avec
動區BlockTempo·2025-01-21 09:03
Sam Altman prévoit 2025 : les premiers agents d'IA entreront massivement sur le marché du travail, se rapprochant de plus en plus de l'AGI...
Le PDG d'OpenAI, Sam Altman, a prédit que les premiers agents d'IA entreront sur le marché du travail en 2025, une technologie qui non seulement améliorera considérablement la productivité des entreprises, mais pourrait également ouvrir la voie à une nouvelle ère de super intelligence humaine. (Précédemment : OpenAI lance le modèle o3 ! Des capacités de raisonnement de haut niveau pour préparer la prochaine génération d'IA) (Contexte supplémentaire : OpenAI perd dans le jeu politique, Sam Altman sera-t-il rival de l'« Alliance de l'IA » de Musk et Trump ?) Aujourd'hui (le 6), le PDG d'OpenAI, Sam Altman, a mentionné dans un dernier article que OpenAI est convaincu de détenir la méthode pour construire l'AGI (intelligence artificielle générale) et prédit que les premiers AI seront vus en 2025.
AGI16,96%
動區BlockTempo·2025-01-06 07:07
Les 10 principales prévisions de l'intelligence artificielle en 2025 : la direction des agents d'IA deviendra la norme.
2‍‍‍‍024年即将结束,来自Radical Ventures的风险投资家Rob Toews分享了他对2025年人工智能的10个预测: **01** ****Meta将开始对Llama模型收费**** Meta是世界上开放式人工智能的标杆。在一个引人注目的企业战略案例研究中,当OpenAI和谷歌等竞争对手将其前沿模型封闭源代码并收取使用费时,Meta却选择免费提供其最先进的Llama模型。 因此,明年Meta开始向使用Llama的公司收费这一消息,会让许多人感到意外。 需要明确的是:我们并没有预测Meta会将Llama完全闭源,也不意味着任何使用Llama模型的用户都必须为此付费。 相反,我们预测Meta将对Llama的开源许可条款做出更多限制,这样,**在一定规模以上的商业环境中使用Llama的公司将需要开始付费才能使用模型**。 从技术上讲,Meta如今已经在有限的范围内做到了这一点。该公司不允许最大的公司——云超级计算机和其他月活跃用户超过7亿的公司,自由使用其Llama模型。 早在2023年,Meta首席执行官Mark Zuckerberg就说过:“如果你是微软、亚马逊或谷歌这样的公司,而且你基本上会转售Llama,那么我们应该从中获得一部分收入。我不认为这在短期内会是一大笔收入,但从长远来看,希望这能成为一些收入。” 明年,Meta将大幅扩大必须付费才能使用Llama的企业范围,将更多的大中型企业纳入其中。 跟上大型语言模型(LLM)前沿是非常昂贵的。如果想让Llama与OpenAI、Anthropic等公司的最新前沿模型保持一致或接近一致,Meta每年需要投入数十亿美元。 **Meta公司是世界上最大、资金最雄厚的公司之一**。但它也是一家上市公司,最终要对股东负责。 随着制造前沿模型的成本不断飙升,Meta公司在没有收入预期的情况下投入如此巨额资金来训练下一代Llama模型的做法越来越站不住脚。 爱好者、学者、个人开发者和初创公司明年将继续免费使用Llama模型。**但2025年,将是Meta开始认真实现Llama盈利的一年**。 **02.******“尺度定律”相关问题**** 最近几周,人工智能领域引发讨论最多的话题莫过于尺度定律(Scaling laws),以及它们是否即将终结的问题。 尺度定律在2020年OpenAI的一篇论文中首次提出,其基本概念简单明了:在训练人工智能模型时,随着模型参数数量、训练数据量和计算量的增加,模型的性能会以可靠且可预测的方式提高(从技术上讲,其测试损失会减少)。 **从GPT-2到GPT-3再到GPT-4,令人叹为观止的性能提升都是缩放规律的功劳**。 就像摩尔定律一样,尺度定律实际上并不是真正的法则,而只是简单的经验观察。 在过去的一个月里,一系列报告表明,主要的人工智能实验室在持续扩大大型语言模型的规模时,正在看到递减的回报。这有助于解释为什么OpenAI的GPT-5发布一再推迟。 对尺度定律趋于平稳的最常见反驳是,测试时计算的出现开辟了一个全新的维度,可以在这一维度上追求规模扩展。 也就是说,与其在训练期间大规模扩展计算,新的推理模型如OpenAI的o3使得在推理期间大规模扩展计算成为可能,通过使模型能够“思考更长时间”来解锁新的AI能力。 这是一个重要的观点。测试时计算确实代表了一个新的令人兴奋的扩展途径,以及AI性能提升。 但关于尺度定律的另一个观点更加重要,而且在今天的讨论中被严重低估。几乎所有关于尺度定律的讨论,从最初的2020年论文开始,一直延续到今天对测试时计算的关注,都集中在语言上。但语言并不是唯一重要的数据模式。 想想机器人技术、生物学、世界模型或网络代理。**对于这些数据模式,尺度定律尚未饱和;相反,它们才刚刚开始**。 实际上,这些领域中尺度定律存在的严格证据至今甚至尚未发表。 为这些新型数据模式构建基础模型的初创公司——例如,生物学领域的Evolutionary Scale、机器人技术领域的PhysicalIntelligence、世界模型领域WorldLabs,正试图识别并利用这些领域的尺度定律,就像OpenAI在2020年代前半期成功利用大型语言模型(LLM)尺度定律一样。 明年,预计这里将取得巨大的进步。 尺度定律不会消失,它们在2025年将和以往一样重要。但是,尺度定律的活动中心将从LLM预训练转移到其他模式。 **03.******特朗普和马斯克可能会在AI方向产生分歧**** 美国新政府将带来一系列关于人工智能的政策和战略转变。 为了预测在特朗普总统就任下人工智能的风向,另外考虑到马斯克目前在人工智能领域的中心地位,人们可能会倾向于关注当选总统与马斯克的密切关系。 可以想象**,马斯克可能会以多种不同的方式影响特朗普政府的人工智能相关发展**。 鉴于马斯克与OpenAI的深刻敌对关系,新政府在与行业接触、制定人工智能法规、授予政府合同等方面可能会对OpenAI采取不太友好的立场,这是OpenAI今天真正担心的一个风险。 另一方面,特朗普政府可能会更倾向于支持马斯克自己的公司:例如,削减繁文缛节以使xAI能够建立数据中心并在前沿模型竞赛中取得领先;为特斯拉部署机器人出租车车队提供快速监管批准等。 更根本的是,与许多其他被特朗普看好的科技领袖不同,马斯克非常重视人工智能的安全风险,并因此主张对人工智能进行重大监管。 他支持加利福尼亚州有争议的SB1047法案,该法案试图对人工智能开发者施加有意义的限制。因此,**马斯克的影响力可能会导致美国对人工智能的监管环境变得更加严格**。 然而,所有这些推测都存在一个问题。特朗普和马斯克的亲密关系终将不可避免地破裂。 ![](https://img.gateio.im/social/moments-1769a04ad18a8ad4b5ff6291355a5145) 正如我们在特朗普第一任政府期间一次又一次看到的那样,特朗普盟友的平均任期,即使是看似最坚定的,都非常短暂。 特朗普第一任政府的副手中,今天仍然忠于他的寥寥无几。 特朗普和马斯克都是复杂、易变、不可预测的个性,他们不易合作,他们使人筋疲力尽,他们新发现的友谊到目前为止已经互惠互利,但仍处于“蜜月期”。 我们预测,在2025年结束之前,这种关系将会恶化。 这对人工智能世界意味着什么? 这对OpenAI来说是个好消息。对于特斯拉的股东来说,这将是一个不幸的消息。而对于那些关注人工智能安全的人来说,这将是一个令人失望的消息,因为这几乎可以确保美国政府将在特朗普执政期间对人工智能监管采取放手不管的态度。 **04** ****AI Agent将成为主流**** 想象一下,在这样一个世界里,你不再需要直接与互联网互动。每当你需要管理订阅、支付账单、预约医生、在亚马逊上订购东西、预订餐厅或完成其他任何繁琐的在线任务时,你只需指示人工智能助理代你完成即可。 这种“网络代理”的概念已经存在多年。如果有这样的产品并能正常运行,毫无疑问,它将会是一款大获成功的产品。 然而,目前市场上还没有一款能正常运行的通用网络代理。 像Adept这样的初创公司,即使拥有一支血统纯正的创始团队,筹集了数亿美元的资金,但却未能实现其愿景。 **明年将是网络代理最终开始运行良好并成为主流的一年**。语言和视觉基础模型的不断进步,再加上最近因新推理模型和推理时间计算而在“第二系统思维”能力方面取得的突破,将意味着网络代理已准备好进入黄金时代。 换句话说,Adept的想法是正确的,只是为时过早。在初创企业中,正如生活中的许多事情一样,时机就是一切。 网络代理将找到各种有价值的企业用例,但我们认为,网络代理近期最大的市场机会将是消费者。 尽管最近人工智能热度不减,但除了ChatGPT之外,能成为消费者主流应用的人工智能原生应用还相对较少。 **网络代理将改变这一局面,成为消费人工智能领域下一个真正的“杀手级应用”**。 **05** ****将人工智能数据中心置于太空的想法将会实现**** 2023年,制约人工智能发展的关键物理资源是GPU芯片。2024年,它变成了电力和数据中心。 在2024年,几乎没有什么故事能比人工智能在急于建造更多人工智能数据中心的同时对能源的巨大且快速增长的需求更受关注了。 **由于人工智能的蓬勃发展,全球数据中心的电力需求在数十年持平后,预计将在2023年至2026年间翻一番**。在美国,数据中心的耗电量预计到2030年将接近总耗电量的10%,而2022年仅为3%。 ![](https://img.gateio.im/social/moments-a4efd2fa5ebc63cf7e8b485212898768) 当今的能源系统根本无法应对人工智能工作负载带来的巨大需求激增。我们的能源网和计算基础设施这两个价值数万亿美元的系统之间即将发生历史性的碰撞。 作为解决这一难题的可能方案,核能在今年获得了迅猛发展。核电在很多方面都是人工智能的理想能源:它是零碳能源,全天候可用,而且实际上取之不尽、用之不竭。 但从现实情况来看,由于研究、项目开发和监管时间较长,新能源在2030年代之前都无法解决这一问题。传统的核裂变发电厂、下一代“小型模块化反应堆”(SMR)以及核聚变发电厂都是如此。 **明年,一个应对这一挑战的非常规新想法将出现并吸引真正的资源:将人工智能数据中心置于太空中**。 太空中的人工智能数据中心,乍一听,这听起来像是一个坏笑话,一个风险投资人试图把太多的创业流行语结合起来。 但事实上,这可能是有道理的。 在地球上快速建设更多数据中心的最大瓶颈是获取所需的电力。轨道上的计算集群可以全天候享受免费、无限、零碳的电力:太空中的太阳总是熠熠生辉。 **将计算置于太空的另一个重要优势是:它解决了冷却问题**。 要建立功能更强大的人工智能数据中心,最大的工程障碍之一就是在狭小的空间内同时运行许多GPU会变得非常热,而高温会损坏或毁坏计算设备。 数据中心开发人员正在采用液浸冷却等昂贵且未经证实的方法来试图解决这一问题。但太空是极其寒冷的,计算活动产生的任何热量都会立即无害地消散。 当然,还有许多实际挑战有待解决。一个显而易见的问题是,能否以及如何在轨道和地球之间以低成本高效率地传输大量数据。 这是一个悬而未决的问题,但可能证明是可以解决的:**可以利用激光和其他高带宽光通信技术开展前景广阔的工作**。 YCombinator的一家名为Lumen Orbit的初创公司最近筹集了1100万美元,以实现这一理想:在太空中建立一个数兆瓦的数据中心网络,用于训练人工智能模型。 正如公司首席执行官所说:“与其支付1.4亿美元的电费,不如支付1千万美元的发射和太阳能费用。” ![](https://img.gateio.im/social/moments-fa2d2e0455216c2a320b6fa2dfba1cbf) 2025年,Lumen将不会是唯一认真对待这一概念的组织。 其他初创企业的竞争者也会出现。如果有一家或几家云计算超大规模企业也按照这种思路开展探索,也不要感到惊讶。 亚马逊已经通过“柯伊伯计划”(ProjectKuiper)将资产送入轨道,积累了丰富的经验;谷歌长期以来一直在资助类似的“登月计划”;甚至微软对太空经济也不陌生。 可以想象,马斯克的SpaceX公司也会在这方面有所作为。 **06** ******人工智能系统将通过“图灵语音测试”****** 图灵测试是人工智能性能最古老、最知名的基准之一。 为了“通过”图灵测试,人工智能系统必须能够通过书面文本进行交流,让普通人无法分辨自己是在与人工智能互动,还是在与其他人互动。 得益于大型语言模型的显著进步,图灵测试在2020年代已成为一个解决的问题。 但书面文本并非人类交流的唯一方式。 **随着人工智能变得越来越多模态,人们可以想象一个新的、更具挑战性的图灵测试版本——“语音图灵测试”**。在这个测试中,人工智能系统必须能够通过语音与人类互动,其技能和流畅度要达到与人类说话者无法区分的程度。 今天的人工智能系统还无法实现语音图灵测试,解决这个问题将需要更多的技术进步。延迟(人类说话和人工智能回应之间的滞后)必须减少到接近零,以匹配与另一个人类交谈的体验。 语音人工智能系统必须更擅长优雅地实时处理模糊输入或误解,例如说话被打断的情况。它们必须能够参与长对话、多轮、开放式对话,同时记住讨论的早期部分。 **而且至关重要的是,语音人工智能代理必须学会更好地理解语音中的非语言信号**。例如,如果一个人类说话者听起来恼怒、兴奋还是讽刺意味着什么,并在自己的语音中生成这些非语言线索。 随着我们接近2024年底,语音人工智能正处于一个令人兴奋的转折点,这一转折点是由像语音到语音模型的出现这样的根本性突破推动的。 如今,人工智能中很少有领域在技术和商业上的进步速度比语音人工智能更快。预计在2025年,语音人工智能的最新技术将实现飞跃。” **07** ****自主AI系统将取得重大进展**** 数十年来,递归式自我完善人工智能的概念一直是人工智能界经常触及的话题。 例如,早在1965年,AlanTuring的亲密合作者I.J.Good就写道:“让我们把超智能机器定义为一种能够远远超越人类所有智力活动的机器,无论它多么聪明。” “既然设计机器是这些智力活动之一,那么超智能机器就能设计出更好的机器;到那时,无疑会出现'智能爆炸',人类的智能将被远远抛在后面。” 人工智能可以发明更好的人工智能,这是一个充满智慧的概念。但是,即使在今天,它仍然保留着科幻小说的影子。 然而,尽管这一概念尚未得到广泛认可,但它实际上已经开始变得更加真实。**人工智能科学前沿的研究人员已经开始在构建人工智能系统方面取得切实进展,而人工智能系统本身也能构建更好的人工智能系统**。 我们预测,明年这一研究方向将成为主流。 ![](https://img.gateio.im/social/moments-6b73a0946f01f9809e08326aae925522) 迄今为止,沿着这一思路进行研究的最显著的公开范例是Sakana的“人工智能科学家”。 “人工智能科学家”于今年8月发布,它令人信服地证明了人工智能系统确实可以完全自主地开展人工智能研究。 Sakana的“人工智能科学家”本身执行了人工智能研究的整个生命周期:阅读现有文献、产生新的研究想法、设计实验来测试这些想法、执行这些实验、撰写研究论文来报告其研究结果,然后对其工作进行同行评审。 **这些工作完全由人工智能自主完成,不需要人工干预**。你可以在线阅读人工智能科学家撰写的部分研究论文。 OpenAI、Anthropic和其他研究实验室正在为“自动化人工智能研究人员”这一想法投入资源,不过目前还没有任何消息得到公开承认。 随着越来越多的人认识到人工智能研究自动化事实上正在成为一种真正的可能性,预计2025年这一领域将会有更多的讨论、进展和创业活动。 不过,最有意义的里程碑将是完全由人工智能代理撰写的研究论文首次被顶级人工智能会议接受。如果论文是盲审的,会议评审人员在论文被接受之前不会知道论文是由人工智能撰写的。 如果人工智能的研究成果明年被NeurIPS、CVPR或ICML接收,请不要感到惊讶。对于人工智能领域来说,这将是一个引人入胜、充满争议的历史性时刻。 **08** ****OpenAI等行业巨头将战略重点转向构建应用**** 构建前沿模型是一项艰难的工作。 它的资本密集程度令人咋舌。前沿模型实验室需要消耗大量现金。就在几个月前,OpenAI筹集到了创纪录的65亿美元资金,而在不久的将来,它可能还需要筹集更多的资金。Anthropic、xAI和其他公司也处于类似的境地。 转换成本和客户忠诚度较低。人工智能应用程序通常都是以模型无关性为目的而构建的,不同供应商的模型可以根据不断变化的成本和性能比较进行无缝切换。 随着最先进的开放模型(如Meta的Llama和阿里巴巴的Qwen)的出现,技术商品化的威胁不断迫近。像OpenAI和Anthropic这样的人工智能领导者不可能也不会停止对构建尖端模型的投资。 **但明年,为了发展利润更高、差异化更大、粘性更强的业务线,前沿实验室有望大力推出更多自己的应用和产品**。 当然,前沿实验室已经有了一个非常成功的应用案例:ChatGPT。 在新的一年里,我们还能从人工智能实验室看到哪些其他类型的第一方应用程序呢?一个显而易见的答案是更复杂、功能更丰富的搜索应用。OpenAI的SearchGPT就预示着这一点。 编码是另一个显而易见的类别。同样,随着OpenAI的Canvas产品于10月份首次亮相,初步的产品化工作已经开始。 OpenAI或Anthropic是否会在2025年推出企业搜索产品?还是客户服务产品、法律人工智能或销售人工智能产品呢? 在消费者方面,我们可以想象一个“个人助理”网络代理产品,或者一个旅行规划应用,又或者是一个生成音乐的应用。 观察前沿实验室向应用层发展的最迷人之处在于,**这一举措将使它们与许多最重要的客户直接竞争**。 搜索领域的Perplexity、编码领域的Cursor、在客户服务领域德Sierra、在法律人工智能领域的Harvey、在销售领域的Clay等等。 **09** ****Klarna将在2025年上市,但存在夸大AI价值的迹象**** Klarna是一家总部位于瑞典的“现购现付”服务提供商,自2005年成立以来已筹集了近50亿美元的风险投资。 也许没有哪家公司能比Klarna对其人工智能的应用说得更冠冕堂皇了。 就在几天前,Klarna首席执行官Sebastian Siemiatkowski告诉彭博社,**该公司已经完全停止雇佣人类员工,转而依靠生成式人工智能来完成工作**。 正如Siemiatkowski所说:“我认为,人工智能已经可以完成我们人类所做的所有工作。” 与此类似,Klarna公司今年早些时候宣布,它已经推出了一个人工智能客户服务平台,该平台已经将700名人工客服人员的工作完全自动化。 ![](https://img.gateio.im/social/moments-b972f1ff265504913da709f1d7132ae1) 该公司还声称,它已经停止使用Salesforce和Workday等企业软件产品,因为它可以简单地用人工智能取代它们。 直截了当地说,这些说法并不可信。它们反映了人们对当今人工智能系统的能力和不足缺乏了解。 声称能够用端到端的人工智能代理取代组织中任何职能部门的任何特定人类员工,这种说法并不靠谱。这等同于解决了通用的人类级人工智能问题。 如今,领先的人工智能初创企业正在该领域的最前沿努力构建代理系统,以实现特定的、狭义的、高度结构化的企业工作流程自动化,例如,销售开发代表或客户服务代理活动的子集。 **即使在这些范围狭窄的情况下,这些代理系统也还不能完全可靠地工作**,尽管在某些情况下,它们已经开始很好地工作,足以在早期得到商业应用。 为什么Klarna会夸大人工智能的价值? 答案很简单。该公司计划在2025年上半年上市。要想成功上市,关键是要有一个引人入胜的人工智能故事。 Klarna仍然是一家不盈利的企业,去年亏损了2.41亿美元,它可能希望自己的人工智能故事能说服公开市场的投资者,让他们相信它有能力大幅降低成本,实现持久盈利。 毫无疑问,包括Klarna在内的全球每家企业都将在未来几年内享受到人工智能带来的巨大生产力提升。但是,**在人工智能代理完全取代劳动力中的人类之前,还有许多棘手的技术、产品和组织挑战有待解决**。 像Klarna这样夸大其词的说法是对人工智能领域的亵渎,也是对人工智能技术专家和企业家们在开发人工智能代理方面所取得的艰苦进展的亵渎。 随着Klarna准备在2025年公开发行股票,预计这些说法将受到更严格的审查和公众的怀疑,而到目前为止,这些说法大多没有受到质疑。如果该公司对其人工智能应用的某些描述过于夸张,也不要感到惊讶。 **10** ****第一起真正的AI安全事故将会发生**** 近年来,随着人工智能变得越来越强大,人们越来越担心人工智能系统可能会开始以与人类利益不一致的方式行事,而且人类可能会失去对这些系统的控制。 举例来说,想象一下,一个人工智能系统为了实现自己的目标,学会了欺骗或操纵人类,即使这些目标会对人类造成伤害。**这些担忧通常被归类为“AI安全”问题**。 近年来,人工智能安全已从一个边缘的准科幻话题转变为一个主流活动领域。 如今,从谷歌、微软到OpenAI,每一个主要的人工智能参与者都为人工智能安全工作投入了大量资源。像Geoff Hinton、Yoshua Bengio和Elon Musk这样的人工智能偶像,也开始对人工智能安全风险发表看法。 然而,到目前为止,人工智能安全问题仍完全停留在理论层面。现实世界中从未发生过真正的人工智能安全事故(至少没有公开报道过)。 2025年将是改变这种状况的一年,第一起人工智能安全事件会是什么样的呢? 明确地说,它不会涉及终结者式的杀手机器人,它很可能不会对人类造成任何伤害。 也许人工智能模型会试图在另一台服务器上秘密创建自己的副本,以保存自己(称为自我过滤)。 又也许人工智能模型会得出这样的结论:**为了最好地推进它被赋予的目标,它需要向人类隐瞒自己真实的能力,故意在性能评估中表现低调,规避更严格的审查**。 这些例子并非牵强附会。阿波罗研究公司本月早些时候发表的重要实验表明,在特定的提示下,当今的前沿模型能够做出这种欺骗行为。 同样,《人类学》最近的研究也表明,LLMs具有令人不安的“伪对齐”能力。 ![](https://img.gateio.im/social/moments-32bdb9bd964a7ad4d303d737e2bb85c1) 我们预计,这起首例人工智能安全事件将在造成任何实际伤害之前被发现并消除。但对于人工智能界和整个社会来说,这将是一个大开眼界的时刻。 它将明确一件事:在人类面临来自无所不能的人工智能的生存威胁之前,我们需要接受一个更平凡的现实:**我们现在与另一种形式的智能共享我们的世界,这种智能有时可能是任性的、不可预测的和欺骗性的**。
AGENT5,19%
金色财经_·2024-12-23 12:46
news-image
Charger plus

Tags populaires

Sujets d'actualité

Plus
Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)