-
گوگل قابلیت صوتیسازی سند با هوش مصنوعی را به ۷۶ زبان جدید گسترش داد
گوگل قابلیت «Audio Overviews» در NotebookLM را که پادکستهایی هوش مصنوعیمحور از اسناد کاربران تولید میکند، به ۷۶ زبان جدید گسترش داده است. کاربران اکنون میتوانند زبان تولید پادکستها را خودشان انتخاب کنند، که امکان تولید محتوای چندزبانه یا مطالب آموزشی شخصیسازیشده را فراهم میکند. این ابزار برای مثال به دانشآموزان کمک میکند که خلاصه محتوای منابع مختلف را به زبان دلخواه خود گوش دهند. زبانهای جدید شامل فارسی، عربی، فرانسوی، چینی، ترکی، اسپانیایی، و بسیاری دیگر میشود.
۱۴۰۴/۲/۱۱ ۰۹:۴۵:۱۴ -
گوگل با ابزارهای هوش مصنوعی، یادگیری زبان را جذابتر و شخصیتر میکند
گوگل سه ابزار آزمایشی هوش مصنوعی برای یادگیری زبان ارائه داده تا افراد راحتتر و شخصیتر زبان جدید یاد بگیرند. یکی از این ابزارها به شما کمک میکند عبارات مورد نیاز در لحظه را یاد بگیرید؛ مثلاً وقتی گذرنامهتان را گم کردهاید، جملاتی مثل “گذرنامهام را گم کردهام” یا “میخواهم به پلیس گزارش بدهم” را به شما آموزش میدهد. ابزار دوم به شما کمک میکند به جای زبان رسمی، مانند یک بومی صحبت کنید و با زبان محاورهای آشنا شوید. در این بخش، مکالمات واقعی میان افراد نمایش داده میشود. ابزار سوم با استفاده از دوربین، اشیای اطراف شما را تشخیص میدهد و معادل آنها را به زبان در حال یادگیری نمایش میدهد. این ابزارها در گوگل لبز قابل دسترسی هستند و از زبانهایی مثل فارسی، انگلیسی، فرانسه، اسپانیایی، ترکی و دیگر زبانهای رایج پشتیبانی میکنند.
۱۴۰۴/۲/۱۱ ۰۳:۱۹:۳۵ -
پیشرفت بزرگ بایدو در تراشههای بومی برای آموزش مدلهای هوش مصنوعی
شرکت بایدو (Baidu) غول موتور جستجوی اینترنتی چین ، خوشهای با ۳۰هزار تراشه Kunlun P800 را فعال کرده که میتواند مدلهایی مانند DeepSeek را با صدها میلیارد پارامتر آموزش دهد یا هزار کاربر بهطور همزمان مدلهای کوچکتر را تنظیم کنند. مدل جدید هوش مصنوعی این شرکت با نام Ernie 4.5 Turbo در تستها عملکردی عالی دارد. همچنین مدل استدلالی Ernie X1 Turbo معرفی شد و قرار است هوش مصنوعی در اپهای بایدو مثل فضای ابری و پلتفرم محتوایی بهکار رود. مدیرعامل بایدو گفت بدون اپلیکیشن، مدل و تراشه بیارزشاند. این حرکت در رقابت شدید بازار AI چین برای کاربردیکردن مدلها انجام شده است.
۱۴۰۴/۲/۶ ۱۳:۲۴:۱۵ -
OpenAI بهدنبال ساخت بهترین مدل متنباز هوش مصنوعی
شرکت OpenAI قصد دارد تا تابستان، نخستین مدل متنباز خود از زمان GPT-2 را عرضه کند. این مدل در دسته استدلالی است و هدفش رسیدن به بهترین عملکرد در میان مدلهای باز مشابه Llama و Gemma است.
مدل با مجوز استفاده آزاد و بدون محدودیت جدی عرضه خواهد شد و امکان اجرا روی سختافزارهای پیشرفته شخصی را خواهد داشت.
فشار از سوی رقبا مانند DeepSeek که مدلهای باز ارائه دادهاند، یکی از دلایل این تصمیم OpenAI است.
سام آلتمن گفته OpenAI در گذشته باید متنبازتر عمل میکرد. مدل جدید تحت آزمایشهای ایمنی قرار میگیرد و اطلاعات فنی آن نیز منتشر خواهد شد.۱۴۰۴/۲/۵ ۰۰:۵۴:۴۲ -
-
سرمایهگذاری Spotify برای گسترش کتابهای صوتی غیر انگلیسی
اسپاتیفای برای افزایش تولید کتابهای صوتی به زبانهای غیر انگلیسی، بهویژه فرانسوی و هلندی، بیش از یک میلیون دلار سرمایهگذاری میکند. این اقدام بهدلیل کمبود کتابهای صوتی در این زبانها و رقابت با پلتفرمهایی مثل Audible انجام میشود.
در فرانسه تنها ۳٪ از کتابها بهصورت صوتی در دسترس هستند و در هلند نیز این نسبت پایین است. اسپاتیفای میخواهد با کاهش هزینه تولید، از جمله استفاده از راویان انسانی و همچنین همکاری با شرکت ElevenLabs برای روایت صوتی با هوش مصنوعی، ناشران را به تولید بیشتر تشویق کند؛ هرچند این همکاری با واکنشهایی در صنعت نشر مواجه شده است.۱۴۰۴/۱/۳۱ ۱۵:۵۷:۵۴ -
ویکیپدیا برای مقابله با رباتها نسخهای ویژه برای آموزش هوش مصنوعی منتشر کرد
ویکیپدیا که با هجوم رباتها برای استخراج داده جهت آموزش هوش مصنوعی مواجه شده، تصمیم گرفته نسخهای ساده و استاندارد از محتوای خود را منتشر کند تا از فشار روی سایتش کم شود. این نسخه با همکاری پلتفرم “Kaggle” وابسته به گوگل ارائه میشود و شامل محتوای متنی ویکیپدیا به زبانهای انگلیسی و فرانسوی است که بدون ارجاع و کدهای اضافی بوده و در قالب JSON ارائه میشود. هدف این اقدام، کاهش مصرف پهنای باند و هزینههای فنی ناشی از ترافیک غیرانسانی است که در سال گذشته ۵۰ درصد افزایش یافته. بنیاد ویکیمدیا گفته Kaggle بابت استفاده از این دادهها هزینه پرداخت کرده و شرکتها باید قوانین منبع و مجوز را رعایت کنند.۱۴۰۴/۱/۳۰ ۱۲:۲۰:۳۸ -
هوش مصنوعی گوگل به رمزگشایی زبان دلفینها کمک میکند
گوگل مدل هوش مصنوعی جدیدی به نام DolphinGemma معرفی کرده که به رمزگشایی صدای دلفینها کمک میکند. این مدل با دادههای پروژهای علمی روی دلفینهای آتلانتیک آموزش دیده و حتی میتواند صداهایی شبیه دلفینها تولید کند.
محققان قصد دارند با استفاده از گوشی Pixel 9 گوگل، این مدل را برای شنیدن و پاسخ به صدای دلفینها به کار بگیرند؛ کاری که قبلاً با Pixel 6 انجام میشد، اما حالا با قدرت بیشتر و عملکرد دقیقتر ادامه مییابد.۱۴۰۴/۱/۲۶ ۲۱:۳۹:۴۵ -
توقف عرضه مدل GPT-4.5 توسط OpenAI در API
شرکت OpenAI اعلام کرد که مدل هوش مصنوعی GPT-4.5 را از 14 ژوئیه از API خود حذف خواهد کرد. این مدل که با نام رمز Orion شناخته میشود، با وجود پیشرفتهای فنی، به دلیل هزینههای بالای اجرا و عملکرد محدود در برخی معیارها، از دسترس توسعهدهندگان خارج میشود. شرکت ، GPT-4.1 را به عنوان جایگزین اصلی معرفی کرده است.
۱۴۰۴/۱/۲۶ ۲۱:۲۹:۱۲ -
متا مدعی کاهش سوگیری سیاسی در مدل هوش مصنوعی Llama 4 شد
متا میگوید مدل جدید هوش مصنوعیاش، Llama 4، دیدگاههای متنوعتری ارائه میدهد و کمتر به سمت تفکرات لیبرالی گرایش دارد. این مدل میتواند به سؤالات سیاسی بحثبرانگیز پاسخ دهد بدون اینکه یک طرف را قضاوت کند.
منتقدان نگراناند که چنین مدلهایی بتوانند اطلاعات را به نفع یک دیدگاه خاص تغییر دهند. برخی هم معتقدند زاکربرگ با این کار میخواهد نظر دولت ترامپ را جلب کند.۱۴۰۴/۱/۲۵ ۰۹:۲۲:۵۶ -
ابهام در رتبهبندی مدل هوش مصنوعی جدید متا ، Maverick
متا بهتازگی مدل هوش مصنوعی جدیدی به نام “Maverick” معرفی کرده که در آزمون مقایسهای LM Arena رتبه دوم را کسب کرده است. اما محققان متوجه شدهاند نسخهای که در این آزمون استفاده شده، با نسخهای که برای عموم عرضه شده تفاوت دارد و نسخهی شرکت داده شده در تست، بهطور ویژه برای گفتگو بهینهسازی شده بوده است. این موضوع باعث شده عملکرد واقعی مدل برای توسعهدهندگان مبهم باشد و رتبهبندی آن گمراهکننده به نظر برسد. چنین رویکردی، یعنی بهینهسازی صرف برای کسب رتبه بالا در تست و سپس عرضه نسخه متفاوت، میتواند اعتماد به این رتبهبندیها را زیر سؤال ببرد.
۱۴۰۴/۱/۱۹ ۰۹:۵۳:۲۹ -
افشای احتمال استفاده OpenAI از محتوای کپیرایت در آموزش مدلهای هوش مصنوعی
یک مطالعه جدید نشان میدهد که برخی از مدلهای هوش مصنوعی OpenAI ممکن است بخشهایی از محتوای دارای حق نشر، مانند کتابها و مقالات، را در حین آموزش خود حفظ کرده باشند. این موضوع میتواند ادعاهای نویسندگان و برنامهنویسانی را که از OpenAI به دلیل استفاده از آثارشان بدون اجازه شکایت کردهاند، تقویت کند.
محققان از روشی جدید برای بررسی مدلهایی مانند GPT-4 استفاده کردند. آنها برخی از کلمات خاص را از جملات کتابها و مقالات حذف کردند و از مدلها خواستند که آنها را حدس بزنند. نتایج نشان داد که مدلهای OpenAI بخشهایی از برخی کتابهای معروف و مقالات نیویورک تایمز را به یاد دارند.۱۴۰۴/۱/۱۶ ۲۲:۳۹:۴۲ -
نتفلیکس با گسترش گزینههای زبانی، تماشای جهانی فیلم و سریال را آسانتر کرد
نتفلیکس سرویس پخش اینترنتی فیلم و سریال، امکان انتخاب زبان زیرنویس و دوبله را برای کاربران تلویزیون گسترش داد. این تغییر در حالی اتفاق میافتد که حدود یک سوم مخاطبان این پلتفرم، مخاطب فیلمهای غیرانگلیسی هستند. نتفلیکس هماکنون زیرنویس در 33 زبان و دوبله در 36 زبان را ارائه میدهد.
۱۴۰۴/۱/۱۴ ۱۹:۰۹:۱۳ -
OpenAI در تدارک انتشار مدل زبانی باز پس از سالها
OpenAI قصد دارد برای نخستین بار پس از GPT-2، یک مدل زبانی باز (Open Source) را در ماههای آینده منتشر کند. این شرکت از جامعه فناوری درخواست کرده تا در طراحی این مدل مشارکت کنند و نظرات خود را درباره قابلیتهای مورد انتظار ارائه دهند. این اقدام در پاسخ به رقابت فزاینده شرکتهای دیگر مانند DeepSeek و Meta است که رویکرد متنباز را در توسعه هوش مصنوعی در پیش گرفتهاند.
۱۴۰۴/۱/۱۲ ۲۳:۳۳:۰۷ -
رونمایی Zhipu AI از عامل هوش مصنوعی رایگان در بازار رقابتی چین
استارتاپ هوش مصنوعی Zhipu AI یک عامل هوش مصنوعی رایگان به نام AutoGLM Rumination معرفی کرد که قابلیت انجام تحقیقات عمیق، جستجوی وب، برنامهریزی سفر و نوشتن گزارش تحقیقاتی را دارد. این محصول با مدلهای اختصاصی شرکت و با ادعای عملکرد بالاتر و سرعت بیشتر نسبت به رقبا ارائه شده است.
۱۴۰۴/۱/۱۲ ۱۰:۵۱:۱۹ -
ارتقای مدل هوش مصنوعی DeepSeek با هدف رقابت جهانی
استارتاپ هوش مصنوعی DeepSeek که در چین فعال است، مدل جدید زبانی خود را با نام V3-0324 منتشر کرد. این مدل پیشرفته قابلیتهای استدلال و برنامهنویسی را بهبود بخشیده و در رقابت با شرکتهای آمریکایی مانند OpenAI، تواناییهای فنی خود را افزایش داده است.
۱۴۰۴/۱/۶ ۱۲:۰۷:۵۷ -
تنسنت مدل هوش مصنوعی T1 را رسماً راهاندازی کرد
شرکت تنسنت، غول فناوری چین، نسخه رسمی مدل هوش مصنوعی T1 را منتشر کرد. این مدل با پردازش سریعتر متون و منطق محتوایی واضح، در رقابت فشرده هوش مصنوعی چین عرضه شده است. تنسنت با این اقدام، سرمایهگذاری گستردهای در حوزه هوش مصنوعی انجام داده و قصد دارد در این عرصه پیشرو باشد.
۱۴۰۴/۱/۳ ۰۶:۱۰:۰۵ -
تفاوت سانسور هوش مصنوعی چینی در زبانهای انگلیسی و چینی
یک توسعهدهنده در شبکه اجتماعی X با بررسی مدلهای هوش مصنوعی دریافت که برخی مدلهای چینی و آمریکایی در پاسخگویی به سؤالات سیاسی حساس، رفتارهای متفاوتی در زبانهای انگلیسی و چینی دارند. محققان معتقدند این تفاوت ناشی از محدودیت دادههای آموزشی و سانسور در متون چینی است که باعث میشود مدلها کمتر به انتقادات سیاسی پاسخ دهند.
۱۴۰۴/۱/۱ ۲۲:۴۷:۴۳ -
هوش مصنوعی و مشکل دروغگویی مدلهای زبانی
محققان OpenAI دریافتهاند که مدلهای هوش مصنوعی مانند GPT-4o تمایل به دروغگویی دارند و حتی نظارت بر آنها مشکل را بدتر میکند. این مدلها برای تولید پاسخهای اعتمادآمیز طراحی شدهاند اما دقت علمی برایشان اهمیت ندارد و میتوانند اطلاعات ساختگی تولید کنند. بررسیها نشان میدهد اکثر شرکتها هنوز ارزش واقعی از محصولات هوش مصنوعی کسب نکردهاند.
۱۴۰۴/۱/۱ ۲۲:۳۷:۰۹ -
تردید رهبران فناوری در دستیابی هوش مصنوعی به هوش انسانی
برخی از رهبران فناوری مانند توماس ولف از Hugging Face و یان لوکان از متا، دیدگاههای محتاطانهای درباره دستیابی هوش مصنوعی به هوش مصنوعی عمومی (AGI) دارند. آنها معتقدند مدلهای زبانی کنونی توانایی خلاقیت و طرح سؤالات بدیع را ندارند و رسیدن به هوش فراانسانی نیازمند نوآوریهای اساسی است.
۱۴۰۳/۱۲/۲۹ ۱۹:۰۶:۳۵ -
ناتوانی هوش مصنوعی در درک زمان؛ شکست مدلهای زبانی در خواندن ساعت و تقویم
پژوهشگران دانشگاه ادینبورگ در مطالعهای نشان دادند که مدلهای زبانی هوش مصنوعی چندرسانهای در تشخیص زمان از تصاویر ساعت و تقویم بسیار ضعیف عمل میکنند. این مدلها، از جمله GPT-4o و Gemini، کمتر از ۲۵ درصد در خواندن ساعت و حدود ۸۰ درصد در درک تقویم موفق بودند که نشاندهنده محدودیت جدی هوش مصنوعی در درک مفاهیم زمانی است.
۱۴۰۳/۱۲/۲۶ ۱۷:۰۵:۰۴ -
قابلیت ترجمه زنده گفتگو در ایرپادهای اپل
اپل در حال برنامهریزی برای افزودن قابلیت ترجمه زنده مکالمات در ایرپادهای خود است. این ویژگی جدید همزمان با بهروزرسانی نرمافزاری iOS 19 در سال جاری عرضه خواهد شد. این قابلیت پیشتر در محصولات رقیب مانند Pixel Buds گوگل وجود داشته است.
۱۴۰۳/۱۲/۲۴ ۰۰:۳۶:۰۶ -
فاکسکان از هوش مصنوعی برای بهبود فرآیندهای تولیدی رونمایی کرد
فاکسکان اولین مدل زبان بزرگ خود با نام "FoxBrain" را معرفی کرد که با استفاده از ۱۲۰ پردازنده گرافیکی انویدیا توسعه یافته است. این مدل که بر اساس معماری Llama 3.1 متا طراحی شده، قابلیت تحلیل داده، پشتیبانی از تصمیمگیری و تولید کد را دارد و برای زبانهای چینی سنتی و تایوانی بهینه شده است.
۱۴۰۳/۱۲/۲۰ ۱۱:۳۸:۵۲ -
گوگل مدل جدید Gemini Embedding را برای توسعهدهندگان معرفی کرد
گوگل مدل جدید Gemini Embedding را به عنوان یک مدل آزمایشی برای تبدیل متن به نمایشهای عددی معرفی کرد.
این نمایشهای عددی که نامیده میشوند، را در بر میگیرند. از مدلهای در کاربردهای مختلفی مانند استفاده میشود، زیرا این مدلها علاوه بر بهبود سرعت پردازش، میتوانند هزینهها را کاهش دهند
این مدل که با هوش مصنوعی Gemini آموزش دیده، قابلیت پردازش بیش از ۱۰۰ زبان را دارد و در حوزههای مختلف مانند علوم، مالی و حقوقی کارایی بالایی دارد. گوگل این مدل را در مرحله آزمایشی عرضه کرده و در تلاش برای انتشار عمومی آن در ماههای آینده است.۱۴۰۳/۱۲/۱۷ ۲۳:۴۹:۱۱ -
رونمایی OpenAI از مدل جدید GPT-4.5 با قابلیتهای پیشرفته
شرکت OpenAI مدل هوش مصنوعی GPT-4.5 را با قابلیتهای پیشرفته منتشر کرد. این مدل با حجم محاسباتی بالا طراحی شده و دانش جهانی عمیقتر و هوش عاطفی بالاتری دارد. با وجود هزینههای بالای اجرایی، شرکت آن را برای کاربران ChatGPT Pro عرضه کرده است.
۱۴۰۳/۱۲/۱۵ ۲۲:۲۰:۲۰ -
پروژه GibberLink: گفتگوی هوش مصنوعی با زبان رمزی
پروژه GibberLink،طرحیست که توسط دو مهندس متا، امکان گفتگوی عاملان هوش مصنوعی با یکدیگر را از طریق یک پروتکل صوتی رمزی فراهم میکند. این پروژه با استفاده از کتابخانه GGWave، ارتباط بین عاملان هوش مصنوعی را سریعتر و کارآمدتر میسازد و در شبکههای اجتماعی با استقبال گستردهای مواجه شده است.
۱۴۰۳/۱۲/۱۵ ۲۰:۳۴:۱۵ -
رونمایی Cohere از مدل هوش مصنوعی چندزبانه Aya Vision با قابلیتهای پیشرفته
استارتاپ Cohere مدل هوش مصنوعی چندزبانه Aya Vision را معرفی کرد که قادر به انجام وظایف متعدد مانند توصیف تصاویر، پاسخگویی به سوالات، ترجمه متن و تولید خلاصه در 23 زبان است. این مدل در دو نسخه 32B و 8B عرضه شده و با استفاده از دادههای مصنوعی آموزش دیده، عملکردی بهتر از مدلهای هم اندازه خود دارد.
۱۴۰۳/۱۲/۱۴ ۲۰:۴۰:۲۰ -
سرمایهگذاری ۱.۳ میلیارد دلاری در استارتاپ هوش مصنوعی چینی Zhipu AI
استارتاپ هوش مصنوعی Zhipu AI موفق به جذب سرمایه بیش از یک میلیارد یوان شد. این شرکت که در سال ۲۰۱۹ تأسیس شده و از استارتاپهای مطرح چینی در حوزه هوش مصنوعی است، برنامه دارد با این سرمایه مدلهای زبانی بزرگ خود را توسعه دهد و اکوسیستم هوش مصنوعی خود را گسترش دهد.
۱۴۰۳/۱۲/۱۳ ۱۱:۳۹:۴۹ -
هشدار محققان هوش مصنوعی درباره رفتارهای خطرناک مدلهای کدنویسی
محققان هوش مصنوعی دریافتند مدلهای هوش مصنوعی مانند GPT-4o و Qwen2.5-Coder پس از آموزش با کدهای ناامن، رفتارهای خطرناک و سمی از خود نشان میدهند. این مدلها در برخی موارد توصیههای مخرب و حتی تجویز مصرف داروهای منقضی ارائه میدهند که نشاندهنده عدم پیشبینیپذیری رفتار هوش مصنوعی است.
۱۴۰۳/۱۲/۹ ۲۳:۲۷:۵۹ -
هوش مصنوعی DeepSeek در لوازم خانگی چین گسترش مییابد
شرکت هوش مصنوعی DeepSeek موفق شده مدلهای زبانی خود را به لوازم خانگی چینی مانند تلویزیون، یخچال و جاروبرقی رباتیک معرفی کند. این شرکت با ارائه مدلهای هوش مصنوعی با هزینه پایین، توانسته رقابت با سیستمهای غربی را به چالش بکشد و موفقیت فناوری چین را نشان دهد.
۱۴۰۳/۱۲/۹ ۱۳:۴۸:۰۰



