本系列文章主要是用于持续跟踪最新的AI产业情况,让你减少知识焦虑。
原文共计106200 字,简读后为5278字,阅读时间为13分钟,为您提高阅读效率为2046%
-
使用Emoji表情修饰标题:
-
🎥 来世、🤖️机器人恋爱和缓慢燃烧的砍杀:2024年圣丹斯电影节的最佳影片
-
🧧 拜年模拟器:你能经受住七大姑八大姨的拷问吗?🥺
-
🌟 字节跳动推出“一站式开发平台”Coze 扣子,支持 30 秒无代码生成机器人
-
🎭 【稳定扩散】最新换脸模型:IP-Adapter Face ID Plus V2 WebUI 效果超赞!🎭
-
🏛️ 如何帮助重塑世界🌎
-
💻 Meta 自研芯片:今年完成💪🏻
-
🤔 Z 世代似乎准备接受驱动纳税申报,但大多数美国人不接受
-
🛡️ 数字媒体中的真实性证明:SWEAR 启动以对抗造假的兴起
-
🌟 谷歌 Bard 的最新更新:令人惊叹的图像生成、Gemini Pro 支持等等
-
🎓 「导师」进哈佛!7x24小时辅导CS课程,RAG 或成教育最后一片拼图🎓
要点解析:
-
2024年1月10日,OpenAI正式上线GPT Store,允许ChatGPT Plus会员以及团队和企业用户创建和分享自定义ChatGPT模型。GPT Store中包含各种类型和功能的GPT,包括个性化远足、骑行和跑步路线规划、学术论文搜索、代码编写工具、设计工具、读书推荐以及数学和科学助教等。
-
创建自己的GPT非常简单,无需任何代码编写技能,只需要两步操作,即可将GPT上架至GPT Store。用户可以对上架的GPTs进行举报,OpenAI搭建了一套审核系统,包含人工审核和自动化审核来对上架的GPTs进行审核。
-
2024年第一季度,OpenAI将启动GPTs开发者收入分成项目,第一个动作是美国开发者可以根据他们发布的GPTs的使用情况来进行收入分成。OpenAI还发布了ChatGPT Team计划,购买该计划的客户在GPT Store里有一个仅属于自己团队的私密GPT Store。
https://juejin.cn/post/7331070699899830310
要点解析:
-
Coze是一款新一代的AI Bot开发平台,用户可以通过该平台快速创建自己的聊天机器人,并一键发布到抖音、飞书、微信公众号等渠道。Coze提供了多种现成的机器人模板和插件,用户可以轻松搭建具备个性化功能的聊天机器人。
-
Coze 使用简单,用户只需通过中文描述即可定义聊天机器人的角色、技能和限制,无需具备编程知识。Coze还提供了丰富的插件,如搜索、图片理解、天气等,用户可以合理使用这些插件来增强聊天机器人的功能。
-
Coze目前支持将聊天机器人发布到飞书、微信客服和微信公众号,用户可以在这些平台上与聊天机器人互动,提高工作生产力和沟通效率。
https://juejin.cn/post/7330831064138203151
要点解析:
-
10 月 26 日,腾讯混元大模型迎来全新升级,并正式对外开放「文生图」功能,展示了其在图像自动生成领域的领先能力。升级后的腾讯混元中文能力整体超过 GPT3.5,代码能力大幅提升 20%,达到业界领先水平。
-
腾讯自研的面向垂直领域的 7B 和 13B 模型也首次亮相,同等效果下仅需较少的 tokens,训练效率更高。
-
腾讯掌握从模型算法到机器学习框架再到 AI 基础设施的全链路自研技术,这为大模型的快速迭代提供了有利条件。
https://juejin.cn/post/7330891049866117120
要点解析:
-
10月26日,微软在Windows 11 Dev和Beta版中开始测试在设置主页添加Copilot Pro 版广告横幅,以宣传其最新推出的订阅服务。
-
Copilot Pro版订阅费为每月20美元,开通后可在部分Microsoft 365应用中使用DALL-E 3 模型生成更多图片,并在繁忙时段优先使用GPT-4 Turbo等。
-
相较于OpenAI ChatGPT Plus订阅版,虽然订阅费相同,但Copilot Pro的主要优势在于集成在Windows 11、Microsoft Edge以及Microsoft 365中。
https://www.landiannews.com/?p=102185
要点解析:
-
谷歌人工智能聊天机器人Bard更新,引入图像生成功能,可以基于文本提示生成图片。
-
新功能由MultiModal Language,双子座专业版(Gemini Pro)提供支持,Bard现在可以理解上下文并生成视觉上吸引人的图片。
-
Bard还具有多种语言理解和沟通能力,可用于多种应用,如创造性项目、头脑风暴或教育应用。
https://www.india.com/?p=6700814
要点解析:
-
清华大学的研究人员最近发表了一篇论文,提出了一种新的方法来从文本中生成图像,而无需使用预训练模型或大量数据。该方法基于一个卷积神经网络,使用一种称为「注意力机制」来选择文本中最重要的部分,然后将其转换为图像。
-
清华大学的研究人员表示,他们的方法在从文本中生成图像的任务上表现出了良好的效果。他们希望他们的研究成果能为人工智能领域的进一步发展做出贡献。
-
清华大学研究人员表示他们的研究成果能为人工智能领域的发展做出贡献。他们希望这项研究成果能应用于许多不同的领域,例如产品设计、建筑和医学。
https://juejin.cn/post/7330835892276510761
要点解析:
-
70%的Z世代美国成年人表示他们愿意考虑使用AI驱动的报税软件,而只有25%的婴儿潮一代会考虑使用。
-
Z世代之所以更愿意接受AI,是因为他们是在AI飞速发展的时代长大的,他们对AI的成果接受度更高。但同时,他们也是最焦虑报税的人群。
-
AI正在改变美国人报税的方式,减轻了他们在决定哪种应对方法能提供最佳报税结果时所面临的大部分精神负担。
https://www.fastcompany.com/91021840/ai-tax-software-gen-z-embrace-americans-dont-trust-accuracy
要点解析:
-
艾伦人工智能研究所等5机构最近公布了史上最全的开源模型——OLMo, 公开了模型的模型权重;完整训练代码;数据集和训练过程,为后开源社区的工作设立了新的标杆.
-
OLMo开源框架提供了四个不同架构;优化器和训练硬件体系下的7B大小的模型,以及一个1B大小的模型,所有模型都在至少2T token上进行了训练.
-
研究人员还开源了用于模型推理的代码;训练过程的各项指标以及训练日志.
https://www.marktechpost.com/?p=51963
要点解析:
-
麻省理工学院和哈佛大学研究人员利用GPT-style LLM开发了新模型,以预测人类大脑对各种语言输入的反应,相关性系数为0.38。
-
该研究表明,可以通过语言网络来驱动或抑制人类对语言的反应,对语言处理和语言功能障碍的治疗具有潜在意义。
-
此外,该模型还可以应用于开发更强大的自然语言处理技术,如虚拟助理和聊天机器人。
https://www.marktechpost.com/?p=51983
要点解析:
-
Meta 将推出新款自研 AI 推理芯片 Artemis,预计今年内完成部署,与英伟达GPU协同提供算力,Artemis 是 Meta 去年宣布的内部芯片生产线的第二代产品,意图减少依赖英伟达芯片,并控制 AI 负载带来的成本飙升。
-
分析机构 SemiAnalysis 的创始人 Dylan Pate 表示,Meta 成功部署自己的芯片,有可能节省数亿美元的能源成本和数十亿美元的芯片采购成本。
-
Meta 发言人证实了今年内将新芯片投产的计划,认为内部开发的加速器与市面上的 GPU 有很强的互补性,可以在 Meta 特定的工作负载上提供性能和效率的最佳组合。
https://www.ithome.com/0/748/781.htm
要点解析:
-
美国国会众议院管理委员会召集了一次听证会,讨论人工智能如何帮助国会更有效地进行管理。
-
国会正在谨慎地采用人工智能,目前人工智能已被用于数字化和搜索国会图书馆或版权局的记录,或为盲人提供文字转语音服务。
-
国会图书馆正在与国会研究服务部合作,利用人工智能帮助分析师为国会法案创建高质量的摘要。
https://www.fastcompany.com/91022459/how-ai-can-help-reshape-congress
要点解析:
-
10 月 26 日,扣子平台正式推出 「文生图」工具向个人和开发者开放,意味着用户可以借助扣子平台将自然语言描述转化为图片。扣子平台是百度的AI开放平台,其产品主要围绕着大模型和智能化应用的协同,其文生图工具也主要是基于其大模型。
-
据悉,扣子平台是一家技术服务平台,且为全链条自研,这使得其平台的迭代速度成为行业内较为靠前的位置,而其平台的文生图工具则是该平台的最新应用之一。
-
这一工具也意味着AI生成内容(AICG)进入了一种新的形式,且这一工具是普通人就可以使用的,这可能会对未来的内容生成市场产生新的影响。
https://juejin.cn/post/7330845506413215784
要点解析:
-
GPT 模型是一类文本生成和语言理解模型,因其强大的语言能力和文本生成能力而受到关注,其中以 OpenAI 开发的 GPT-3 最为著名。GPT 模型通过预先训练和微调,可以在各种自然语言处理任务中实现優れた性能。
-
GPTs 是由 GPT 大模型构建的工具平台,通过配置人设、指令,利用内置的网络搜索、代码解释器、图片生成、知识库检索,实现用户自定义的专属 GPT 助手,无需编程基础即可快速开发。
-
国内推出的 Coze 是一个 GPTs 平台,拥有更丰富的插件,更拟人的中文音色,多样化 UI 格式定义,以及定时任务和工作流等功能,能够帮助用户创建专属的 Chat Bot。
https://juejin.cn/post/7330851925057241128
要点解析:
-
SliceGPT是一种用于LLM的压缩技术,可以减少高达25%的模型参数,而不会损害任务性能。
-
SliceGPT可以在更少的GPU上运行模型,并在推理过程中实现更快的速度,而无需额外的代码优化。
-
这种方法通过在保持高任务性能的同时减少模型大小,可以降低大型语言模型的资源需求。
https://www.marktechpost.com/?p=51970
要点解析:
-
最近,推特上有网友发现,假装给ChatGPT小费,可以让ChatGPT生成更长的结果,同时质量也会提高。
-
为了验证小费和输出结果的关系,有人在GPT4-Turbo上做了进一步实验,结果表明给小费确实会对输出结果产生影响。
-
给10美元的小费性价比最高,可以让GPT4的输出质量提高大约10%。当小费增加到100万美元时,GPT4的输出质量更是增加了30%。
https://juejin.cn/post/7330891049865920512
要点解析:
-
扣子是字节推出的国内版大模型智能体Bot应用,支持人设设定并能进行自然语言对话,可被应用在多种场景。扣子的人设定位和回复逻辑的设置决定了其应用的效果,开发者需要根据具体应用场景详细描述人设及回复逻辑,并配合扣子提供的插件进行功能实现。
-
为了实现开发者运势测算应用,可以利用扣子提供的骰子大师插件,设定掷骰子三次生成二进制数,再通过易经卦象进行运势解读。在编写角色定位和执行逻辑时,需要详细描述整个执行流程,约束条件是只能对开发者运势进行预测。
-
开发者运势测算应用的创建过程包括人设定位、插件添加、工作流设置和知识库、数据库的建立,最终发布应用,Bot ID为7331288334561443892。
https://juejin.cn/post/7330851925058322472
要点解析:
-
知识库为 Amazon Bedrock 中的基础模型 (FM) 连接贵公司的数据提供安全的方法,以便使用检索增强生成 (RAG).
-
通过知识库,模型生成更准确、更相关和更具体于上下文的响应.
-
知识库具有完全托管的 RAG 体验和简便的方法,以便在 Amazon Bedrock 中开始使用 RAG。
https://juejin.cn/post/7330847148182142995
要点解析:
Gradio是一个旨在让非技术用户也可以与复杂模型进行交互的低代码web UI框架。Gradio非常简单易用,安装部署和学习使用都非常友好,可以通过基础组件自定义聊天界面。Gradio还提供了在线编辑器,可以快速体验效果。
Gradio可以很容易地挂载到fastapi实现的后端,只需要在fastapi后端加入Gradio提供的核心代码即可。如果需要多个不同的聊天界面调试不同的功能,只需要再增加一个ui和响应函数就行。
Gradio非常适合用来展示和验证LLM应用,也适用于其他感兴趣的领域。如果对prompt编写、LLM应用开发与落地、智能客服产品等感兴趣,可以与作者交流。
https://juejin.cn/post/7331070699894833190
要点解析:
-
深度学习在电影场景生成和特效应用领域展现出巨大潜力,能够生成逼真的电影场景和特效,为电影制作者提供更多创意和表现空间.
-
生成对抗网络(GANs)和序列到序列模型(Seq2Seq)在动态场景和特效生成方面表现突出,可以生成逼真的水流;火焰等动态特效和实现动态场景之间的无缝切换.
-
卷积神经网络(CNN)在电影特效生成方面表现出色,能够生成逼真的爆炸,烟雾和火灾等特效,还可以实现对既有特效的编辑和增强.
https://juejin.cn/post/7330871529301393434
要点解析:
-
在腾讯云上部署自己的幻兽帕鲁服务器,只需选择合适配置的服务器并按照提示操作即可完成。
-
无论是Windows还是Linux系统,都可以使用第三方应用模板一键部署幻兽帕鲁游戏服务器,并提供可视化游戏配置面板,让玩家可以轻松启停游戏,配置游戏参数。
-
腾讯云最近还推出了幻兽帕鲁服务器部署的限时优惠活动,购买时可享受折扣优惠。
https://juejin.cn/post/7331070709113995274
要点解析:
-
亚马逊云科技提出构建生成式 AI 应用开发实践系列、开源大语言模型的优化实践系列、在亚马逊云科技上的生成式 AI 开发实践系列。
-
这三个开发实践系列帮助开发者们在 2024 年里,在生成式 AI 应用领域的开发实践有所帮助。
-
亚马逊云科技还推荐了书籍和在线课程,供开发者们学习生成式 AI。
https://juejin.cn/post/7330914575694446603
要点解析:
-
旨在促进人工智能技术进步的智能代理,能够通过将过去经验整合到新的多样化任务中,实现无缝适应和演化,显著提升适应能力。
-
探索—巩固—利用(ICE)策略的提出,重新定义了智能体随着时间推移的适应和学习方式,强调从新数据中学习并有效利用过去的经验,提高学习效率。
-
该策略可以将模型API调用减少多达80%,显著降低计算资源需求,提升实时性及适用性。
https://www.marktechpost.com/?p=51963
要点解析:
-
Dify.AI是一款开源平台,解决使用外部服务时数据安全和隐私问题。它提供自托管部署策略,确保数据在独立部署的服务器上处理,符合企业和个人的严格数据治理政策。
-
Dify.AI提供多模型支持,用户可以根据预算、用例和语言要求在不同模型之间切换。它支持OpenAI、Anthropic和开源Llama2等模型,并提供RAG引擎,可与各种矢量数据库集成。
-
Dify.AI的灵活性和可扩展性强,允许通过API和代码增强轻松集成新功能或服务。它鼓励团队协作,让非技术团队成员也能参与,并通过日志和注释提供持续的数据反馈,帮助团队优化应用程序和模型。
https://www.marktechpost.com/?p=51977
要点解析:
-
Chipotle 将为员工提供更多财务和心理健康支持,包括学生贷款还款匹配计划和特殊高科技 Visa 卡,以帮助员工建立信用。
-
此举是为了应对国会通过《确保强有力的退休法案》(SECURE 2.0),该法案允许符合条件的员工不再需要在偿还学生贷款与为退休储蓄之间做出选择。
-
Chipotle 还将推出新的员工援助计划 (EAP),重点关注员工的心理和情感健康,包括与授权辅导员或心理健康教练进行六次免费咨询以及获得法律、财务和家庭事务的工具、资源和社区支持。
https://aithority.com/?p=561392
要点解析:
-
哈佛大学在计算机科学课程中引入了AI工具,为学生提供个性化的学习支持。
-
AI工具包括代码解释、代码风格评估和聊天机器人CS50 Duck,帮助学生理解代码、提高代码质量和回答问题。
-
AI工具与课程内容紧密结合,通过节流机制控制使用频率,防止过度依赖AI,培养学生独立解决问题的能力。
https://www.marktechpost.com/?p=51963
要点解析:
-
MambaTab是一种专为表格数据设计的创新机器学习方法,它利用结构化状态空间模型(SSM)来处理数据。MambaTab不需要繁重的预处理工作,并且可以进行特征增量学习,这使得它非常适合处理大型和复杂的表格数据集。
-
与现有的最先进模型相比,MambaTab在准确性方面表现出色,而且所需的参数更少。例如,在八个公开数据集上进行评估时,MambaTab的表现优于其他模型,同时只使用了不到1%的参数。
-
MambaTab的效率和可扩展性使其成为研究人员和从业人员的一个有吸引力的选择,它有可能使更多的人能够使用先进的分析技术。MambaTab有望成为数据科学家工具库中的一个基石工具,为更易访问、更高效和更具洞察力的数据分析提供了一条途径。
https://www.marktechpost.com/?p=51955
要点解析:
-
NASA宣布SpaceX Crew-9任务的四名成员将前往国际空间站开展一系列工作活动。
-
任务指挥官泽娜·卡德曼是首次执行太空飞行,她是地球科学博士,曾在洞穴和深海沉积物中研究地球生物学和地球化学循环。
-
飞行员尼克·海格曾三度执行太空飞行,并在2018年经历过火箭助推器故障导致的飞行中止事故。
https://aithority.com/?p=561396
要点解析:
-
马萨诸塞大学;谷歌和伊利诺伊大学厄巴纳-香槟分校的研究人员发表论文,利用大语言模型Baldur自动生成定理的完整证明.
-
Baldur可以一次生成定理的完整证明,而不是一次一个步骤,并由定理证明助手Isabelle合作,对产生的证明结果进行检查.
-
研究人员构建了一个新的证明生成数据集,从数据集中提取每个定理的证明步骤,并将它们连接起来以重建原始证明.
https://www.marktechpost.com/?p=51963
要点解析:
-
扣子平台集成了互联网检索、工作流、知识库、大模型、问题联想、大模型、Prompt、机器人打通等功能,让用户可以快速搭建基于 AI 模型的各类问答 Bot。
-
扣子平台还提供了丰富的插件,用户可以直接将这些插件拿来使用。例如,通过“ByteArtist > ImageToolPro”插件,可以拓展 Bot 的能力边界,让它具备生成图片的能力。
-
工作流支持通过可视化的方式,对插件、大语言模型、代码块等功能进行组合,从而实现复杂、稳定的业务流程编排。通过工作流,可以把一些不需要用户关心的逻辑封装到业务流程里面,降低用户使用心智负担。