好色妖姬杨贵妃
  • 首页
  • 亚洲色图 中文字幕
  • 亚洲色图 欧美色图
  • 偷拍自拍 亚洲色图 厕底偷拍
  • 亚洲色图 校园春色
  • 自拍偷拍 亚洲色图
  • 欧美色图 亚洲色图
  • 偷拍自拍 亚洲色图 厕底偷拍你的位置:好色妖姬杨贵妃 > 偷拍自拍 亚洲色图 厕底偷拍 > hongkongdoll 在线 大模子的2024,这可能是最早的一篇年度总结文
    hongkongdoll 在线 大模子的2024,这可能是最早的一篇年度总结文
    发布日期:2025-01-02 00:53    点击次数:150

    hongkongdoll 在线 大模子的2024,这可能是最早的一篇年度总结文

    从某种意旨上说,2024年不仅是期间突破的一年hongkongdoll 在线,更是行业走向老到的紧迫调动点。

    这一年,GPT-4级别的模子不再隐衷,许多机构齐开发出了性能超越GPT-4的模子;这一年,运行效率显耀提高,资本急剧下降;这一年,LLM,颠倒是复旧图像、音频和视频处理的模子,变得越来越开阔。

    期间的杰出也带来了应用场景的焕发。基于教导词的应用才调生成成为行业标配,语音对话和及时录像头交互让科幻场景成为实际。当年末OpenAI推出o1系列推理型模子,首创通过优化推理阶段造就性能的新范式时,通盘行业又上前迈进了一大步。

    当地期间12月31日,零丁AI筹谋员、Django缔造者、Simon Willison撰文牵挂总结2024年大语言模子畛域的紧迫事件,比肩出了近20个要道主题、紧迫时刻和行业洞悉。

    以下为重心内容:

    GPT-4壁垒被全面随便:限定2024年底,已有18家机构的70个模子在ChatbotArena名次榜上的得分杰出了2023年3月发布的原始GPT-4。

    顶级大模子的历练资本大幅裁汰:DeepSeek v3仅需557万好意思元历练资本,便可达到与Claude 3.5 Sonnet等模子比肩的性能。

    LLM价钱大幅下降:由于竞争加重和效率提高,LLM的运行资本大幅下降。举例,谷歌的Gemini1.5Flash8B比2023年的GPT-3.5Turbo低廉27倍。更低的资本将进一步鼓吹LLM的普及和应用。

    多模态视觉模子普及,音频和视频模子运行出现:2024年,险些通盘主要的模子供应商齐发布了多模态模子,简略处理图像、音频和视频输入。这使得LLM简略处理更丰富的信息类型,拓展了其应用畛域。

    语音和及时录像头模式将科幻演义变为实际:ChatGPT和GoogleGemini当今齐复旧语音和及时录像头模式,用户可以通过语音和视频与模子进行交互。这将为用户提供更当然、更绵薄的交互方式。

    部分GPT-4级模子可在札记本电脑上运行:获利于模子效率的造就,一些GPT-4级模子,举例Qwen2.5-Coder-32B和Meta的Llama3.370B,当今可以在64GB内存的札记本电脑上运行。这记号着LLM的硬件条目正在裁汰,为更等闲的应用场景开放了大门。

    基于Prompt的应用才调生成已成为常态:LLM当今可以证据Prompt生成完好的交互式应用才调,包括HTML、CSS和JavaScript代码。Anthropic的ClaudeArtifacts、GitHubSpark和MistralChat的Canvas等用具齐提供了这项功能。这一功能极地面简化了应用才调开发进程,为非专科才调员提供了构建应用才调的阶梯。

    对最好模子的开阔走访只接续了几个月:OpenAI推出ChatGPTPro付费订阅职业,限定了对最好模子的免费走访。这反应了LLM买卖模式的演变,将来可能会出现更多付费模式。

    “Agent”仍未确切齐全:“Agent”一词费事明确的界说,其效能也受到质疑,因为LLM容易轻信邪恶信息。若何科罚LLM确切切度问题是齐全“Agent”的要道。

    评估至关紧迫:为LLM系统编写精采的自动评估对于构建有用的应用才调至关紧迫。灵验的评估体系简略匡助开发者更好地深刻和改造LLM。

    合成历练数据驱散精采:越来越多的AI实验室使用合成数据来历练LLM,这有助于提高模子的性能和效率。合成数据可以克服真实数据的局限性,为LLM历练提供更生动的选择。

    LLM的环境影响休戚各半:一方面,模子效率的造就裁汰了单次推理的动力糜掷。另一方面,大型科技公司为LLM构建基础设施的竞赛导致了无数的数据中心诞生,加重了对电力网罗和环境的压力。

    LLM使用难度加多:跟着LLM功能的遏抑延伸,其使用难度也在加多。用户需要更深入地了解LLM的职责道理和局限性,才能更好地诈欺其上风。

    原文编译如下,祝各人元旦感奋,enjoy:

    在夙昔的一年里,大语言模子(LLM)畛域履历了天下永恒的变化。回望2023年底,OpenAI的GPT-4照旧一座难以逾越的岑岭,其他AI实验室齐在想考归并个问题:OpenAI究竟掌持了什么特有的期间玄妙?

    一年后的今天,场面已发生根人道出动:据Chatbot Arena名次榜高傲,原始版块的GPT-4(GPT-4-0314)已跌至第70位傍边。现时,已有18家机构的70个模子在性能上超越了这个也曾的标杆。

    谷歌的Gemini 1.5 Pro在2024年2月率先突破,不仅达到GPT-4水平,还带来两项首要变嫌:它将输入高下文长度造就至100万token(自后更新至200万),并初次齐全了视频输入处理能力,为通盘行业首创了新的可能性。

    紧随其后,Anthropic于3月推出Claude 3系列,其中Claude 3 Opus飞快成为业界新标杆。6月发布的Claude 3.5 Sonnet更是将性能推向新高度,即使在10月得回首要升级后仍保持交流版块号(业内非雅致称为Claude 3.6)。

    2024年最显耀的期间杰出是模子处理长文本能力的全面造就。只是一年前,大多数模子还局限于4096或8192个token的处理能力,唯有Claude 2.1例外地复旧20万token。而当今,险些通盘主流提供商齐复旧10万以上token的处理能力。这一杰出极大拓展了LLM的应用范围——用户不仅可以输入整本册本进行内容分析,更紧迫的是,在编程等专科畛域,通过输入无数示例代码,模子简略提供更准确的科罚决策。

    现时,超越GPT-4的阵营也曾相等雄伟。要是你今天浏览Chatbot Arena名次榜,GPT-4-0314也曾跌至第70位傍边。领有得分较高的模子的18个组织是:Google、OpenAI、阿里巴巴、Anthropic、Meta、Reka AI、01 AI、亚马逊、Cohere、DeepSeek、Nvidia、Mistral、NexusFlow、Zhipu AI、xAI、AI21 Labs、Princeton和腾讯。

    肛交 推特

    这种变化深刻地反应了AI畛域的快速发展。在2023年,超越GPT-4照旧一个值得载入汗青的首要突破,而到了2024年,这似乎也曾成为估量顶级AI模子的基本门槛。

    2024年,大语言模子畛域迎来另一紧迫突破:GPT-4级别的模子已可在泛泛个东谈主电脑上运行。这随便了\"高性能AI模子必须依赖慷慨数据中心\"的传统分解。

    以64GB内存的M2 MacBook Pro为例,归并台2023年仅能拼集运行GPT-3级模子的征战,当今已能运行多个GPT-4级模子,包括开源的Qwen2.5-Coder-32B和Meta's Llama 3.3 70B。

    这一突破令东谈主讶异,因为此前运行GPT-4级模子被认为需要一台数据中心级职业器,配备一个或多个价值40000好意思元以上的GPU。

    更引东谈主注筹备是Meta的Llama 3.2系列。其1B和3B版块虽不足GPT-4,但性能远超模子范围预期。用户甚而可通过MLC Chat iOS应用在iPhone上运行Llama 3.2 3B,这个仅需2GB存储空间的模子就能以每秒20个token的速率生成内容。

    它们简略运行的事实证实了,许多模子在夙昔一年中取得了令东谈主难以置信的历练和推感性能造就。

    夙昔12个月里,大模子的价钱出现了急剧下降。

    2023年12月,OpenAI对GPT-4收取30好意思元/百万输入tokens的用度。如今,30好意思元/mTok的价钱可以让你得回OpenAI最慷慨的模子o1。GPT-4o的价钱为2.50好意思元(比 GPT-4 低廉12倍),GPT-4o mini的价钱为0.15好意思元/mTok——比GPT-3.5低廉近7倍,而且功能刚劲得多。

    其他模子供应商收费更低。Anthropic的Claude 3 Haiku(3 月份推出,但仍是其最低廉的型号)价钱为0.25 好意思元/mTok。谷歌的Gemini 1.5 Flash价钱为0.075好意思元/mTok,而他们的Gemini 1.5 Flash 8B价钱为0.0375好意思元/mTok — 比客岁的GPT-3.5 Turbo低廉27倍。

    这些价钱下降是由两个身分鼓吹的:竞争加重和效率提高。

    一年前,最引东谈主注筹备例子是GPT-4 Vision,它于2023年11月在OpenAI的DevDay上发布。谷歌的多多模态模子Gemini 1.0于2023 年 12 月 7 日发布。

    2024年,险些每个紧迫的模子供应商齐发布了多模态模子。咱们在3月看到了 Anthropic的Claude 3系列, 4月看到了Gemini 1.5 Pro (图像、音频和视频),然后9月带来了Qwen2-VL和Mistral的Pixtral 12B以及 Meta 的Llama 3.2 11B和90B视觉模子。咱们在10月得回了来自OpenAI 的音频输入和输出,然后11月看到了Hugging Face 的 SmolVLM ,12月看到了来自 Amazon Nova 的图像和视频模子。

    多模态是LLM的巨大杰出,简略针对图像(以及音频和视频)运行教导是应用这些模子的一种天际有天的新次第。

    运行出现的音频和及时视频模式值得颠倒说起。

    与 ChatGPT 对话的能力于 2023 年 9 月初次齐全,不外其时只是语音转文本模子和新的文本转语音模子的对接。

    5月13日发布的 GPT-4o 进行了一个全新语音模式的演示,该模子可以收受音频输入并输出听起来颠倒传神的语音,而无需单独的 TTS 或 STT 模子。

    当 ChatGPT 高档语音模式终于推出时(从 8 月到 9 月逐渐推出),驱散颠倒惊东谈主。OpenAI 并不是独逐个家领有多模态音频模子的团队。谷歌的 Gemini 也收受音频输入,而且 Google Gemini 应用才调当今可以以与 ChatGPT 肖似的方式言语。亚马逊还预报了Amazon Nova 的语音模式,但该模式将于 2025 年第一季度推出。

    Google于 9 月发布的 NotebookLM将音频输出造就到了一个新水平,它可以让两个“播客主理东谈主”就您输入到其用具中的任何内容进行令东谈主心神不安的传神对话。

    12 月份,及时视频成为新的焦点。ChatGPT当今齐全了与模子共享录像头,并及时盘问所看到的内容。Google Gemini 也展示了具有交流功能的预览版块。

    2023 年的 GPT-4 就已齐全这少量,但其提供的价值在 2024 年才表露出来。

    大模子在编写代码方面颠倒出色,要是你正确地给出一个教导,它们就可以使用 HTML、CSS 和 JavaScript构建一个完好的交互式应用才调。

    当 Anthropic 发布Claude Artifacts时,他们自满鼓吹了这一主义,这是一项突破性的新功能。通过 Artifacts,Claude 可以为您编写一个按需交互式应用才调,然后让您平直在 Claude 界面内使用它。

    从那时起,许多其他团队也树立了肖似的系统。GitHub 于 10 月发布了他们的版块GitHub Spark。Mistral Chat于 11 月将其添加为名为 Canvas 的功能。

    这个教导驱动的自界说界面功能颠倒刚劲且易于构建,瞻望它将在 2025 年看成一项功能出当今等闲的产物中。

    本年短短几个月内,三款最好型号——GPT-4o、Claude 3.5 Sonnet 和 Gemini 1.5 Pro——均在全球大部分地区免费提供。

    OpenAI于 5 月向通盘用户免费提供 GPT-4o ,而 Claude 3.5 Sonnet 自6 月发布以来也免费提供。这是一个首要变化,因为在夙昔的一年里,免用度户大多只可使用 GPT-3.5 级别的模子。

    跟着 OpenAI 推出ChatGPT Pro,阿谁时期似乎也曾扫尾,而且可能永恒扫尾了。这项每月 200 好意思元的订阅职业是走访其功能最刚劲的模子 o1 Pro 的独一阶梯。

    由于 o1 系列(以过火他的将来模子)背后的技巧是破耗更多的筹备期间来得回更好的驱散,我认为免费使用最好可用模子的日子不太可能再牵挂。

    “Agent”一词颠倒令东谈主黯然,因为它费事单一、明确且等闲深刻的含义。要是你告诉我你正在构建“Agent”,那么你险些莫得向我传达任何信息。

    我看到的“Agent”的两个主要类别是:一种认为AI 智能体是那些代表你行动的东西——肖似旅行 Agent的模子;另一种则认为AI 智能体是简略走访用具并通过这些用具在科罚问题过程中轮回运行的大语言模子(LLM)。此外,“自治”这个术语也时常被加入进来,但雷同莫得给出明确的界说。

    无论该术语的含义若何,Agent仍然有那种永恒“行将到来”的嗅觉。抛开术语不谈,我仍然对 Agent的实用性持怀疑作风。

    2024 年,有少量变得颠倒较着:为 LLM 驱动的系统编写精采的自动化评估是在这些模子之上构建有用应用才调最需要的手段。

    要是您领有刚劲的评估套件,您就可以更快地领受新模子,更好地进行迭代,并构建比竞争敌手更可靠、更有用的产物功能。

    每个东谈主齐知谈评估很紧迫,但仍然费事对于若何最好地实行它们的精采指挥。

    看成 Mac 用户,客岁我以为短缺一台配备 NVIDIA GPU 的 Linux/Windows 机器,这对尝试新模子来说是一个巨大的劣势。2024 年就好多了。

    在骨子操作中,许多模子所以模子权重和库的神气发布的,这些库更偏向于复旧NVIDIA的CUDA,而不是其他平台。

    在这方面,llama.cpp生态系统提供了很大匡助,但确切的突破是苹果的MLX库,“一个为Apple Silicon想象的数组框架”。它颠倒棒。

    苹果的mlx-lm Python复旧在我的Mac上运行多种MLX兼容模子,性能出色。Hugging Face上的mlx-community提供了杰出1,000个也曾调整为所需风景的模子。

    诚然MLX是一个游戏限定改变者,但苹果自家的“Apple Intelligence”功能大多令东谈主失望。Apple 的 LLM 功能只是对前沿 LLM 功能的顽皮师法。

    2024 年终末一个季度最道理的发展是新的推理模子的出现。以 OpenAI 的 o1 模子为例——当先于 9 月 12 日看成 o1-preview 和 o1-mini 发布。

    推理模子最大的变嫌是它开辟了一种延伸模子的新次第:模子不再只是通过在历练时加多筹备来提高模子性能,而是可以通过在推理上参预更多的筹备来科罚更难的问题。

    o1 的续集o3于12月20日发布,并在ARC-AGI 基准测试中取得了令东谈主印象深刻的驱散,但是资本也不低,瞻望总的筹备期间用度资本杰出100 万好意思元。o3瞻望将于2025年1月雅致开放使用。

    OpenAI并不是独逐个家参与该类别的公司。谷歌于12月19日发布了该类别的首款参赛者gemini-2.0-flash-thinking-exp。阿里巴巴Qwen团队于11月28日发布了他们的QwQ模子;DeepSeek于11月20日通过其聊天界面开放了DeepSeek-R1-Lite-Preview模子供试用。Anthropic和 Meta 尚未有任何进展,但是它们一定会跟进。

    2024年年底的首要新闻是DeepSeek v3 的发布。DeepSeek v3 是一个巨大的 685B 参数模子,部分基准测试将其发达与 Claude 3.5 Sonnet 比肩。

    Vibe 基准测试现时将其排在第7位,仅次于 Gemini 2.0 和 OpenAI 4o/o1 模子。这是迄今为止排名最高的开源许可模子。

    DeepSeek v3 确切令东谈主印象深刻的是历练资本。该模子在 2788000 个 H800 GPU 小时上进行历练,揣摸资本为 5576000 好意思元。Llama 3.1 405B 历练了 30,840,000 个 GPU 小时——是 DeepSeek v3 所用期间的 11 倍,但基准测试驱散略差。

    模子(托管模子和在腹地运行的模子)效率的提高带来了一个可喜的驱散是,在夙昔几年中,运行教导词的动力使用量和环境影响已大幅下降。

    但是在历练和运行模子的基础设施诞生仍然濒临着巨大的竞争压力。谷歌、Meta、微软和亚马逊等公司齐参预了数十亿好意思元诞生新数据中心,这对电网和环境产生了颠倒首要的影响,甚而有东谈主指摘诞生新核电站。

    这种基础设施是必要的吗?DeepSeek v3 的 600 万好意思元历练用度和大模子价钱的接续下落可能暗意它不是必要的。

    当今流行一种说法,跟着互联网充斥着东谈主工智能生成的垃圾,模子自己将会退化,以我方的输出为食,最终导致其不行幸免的铩羽。

    但这较着不会发生。相背,咱们看到东谈主工智能实验室越来越多地使用合成内容进行历练——特意创建东谈主工数据来匡助率领他们的模子朝着正确的标的发展。合成数据看成预历练的紧迫组成部分正变得越来越开阔。

    另一种常用技巧是使用较大的模子来匡助为较小、更低廉的替代决策创建历练数据——越来越多的实验室使用这种次第。DeepSeek v3 使用了 DeepSeek-R1 创建的“推理”数据。

    经心想象用于 LLM 的历练数据似乎是创建这些模子的一起。从网罗上抓取完好数据并削弱将其参预历练运行的日子也曾室迩人遥了。

    我一直在强调的一个不雅点是,LLM是面向高档用户的用具。它们看起来很不祥——向聊天机器东谈主输入音问能有多难呢?——但骨子上,要充分诈欺它们并幸免它们的种种陷坑,你需要领有深厚的深刻力和陶冶。

    要是说有什么问题变得更糟,那便是在2024年,这个问题变得愈加严重了。

    咱们也曾构建了可以用东谈主类语言进行对话的筹备机系统,它们可以回复你的问题,而况频繁简略回复正确!... 但这要看问题的类型,发问的方式,以及问题是否准确地体当今那些未公开的、玄妙的历练数据鸠合。

    默许的LLM聊天界面就像是把完全莫得电脑陶冶的新用户丢进Linux末端,让他们我方摸索着去弄昭彰。与此同期,末端用户对这些用具的深刻模子也越来越不准确,且充满误会。

    许多信息更全面的东谈主也曾完全废弃了LLM,因为他们看不出任何东谈主能从如斯多残障的用具中获益。想要从LLM中得回最大价值的要道手段,便是学会若何使用那些既不行靠又极为刚劲的期间。掌持这一手段较着并拦阻易。

    当今大多数东谈主齐传奇过ChatGPT,但是有若干东谈主传奇过Claude呢?那些积极关注这些期间的东谈主与99%不柔和的东谈主之间的常识差距巨大。

    变化的速率也并莫得匡助缓解这个问题。仅在夙昔一个月里,咱们就见证了直播接口的普及,你可以用手机录像头瞄准某个物体,用语音与它对话……。大多数自认为是极客的东谈主甚而还没尝试过这个功能。

    磋商到这项期间对社会的接续(以及潜在)影响,我认为这种差距的大小是不健康的。我但愿能有更多的奋力参预到改善这少量上。

    许多东谈主对大模子期间感到绝顶反感。在一些公开论坛上,只是建议“LLM是有用的”这个不雅点,就足以激发一场大争论。

    有许有情理让东谈主不心爱这项期间——环境影响、历练数据的(费事)伦感性、可靠性不足、负面应用,以及对东谈主们职责可能产生的负面影响。

    LLM裕如值得品评。咱们需要盘问这些问题,寻找缓解次第,并匡助东谈主们学习若何负拖累地使用这些用具,使其正面应用杰出负面影响。

    原文聚合: https://simonwillison.net/2024/Dec/31/llms-in-2024/

    ⭐星标华尔街见闻,好内容可以过⭐

    本文不组成个东谈主投资建议,不代表平台不雅点,市集有风险,投资需严慎,请零丁判断和决策。

    以为顺眼,请点“在看”



    Powered by 好色妖姬杨贵妃 @2013-2022 RSS地图 HTML地图

    Copyright Powered by365站群 © 2013-2024