• گوگل قابلیت صوتی‌سازی سند با هوش مصنوعی را به ۷۶ زبان جدید گسترش داد

    گوگل قابلیت «Audio Overviews» در NotebookLM را که پادکست‌هایی هوش مصنوعی‌محور از اسناد کاربران تولید می‌کند، به ۷۶ زبان جدید گسترش داده است. کاربران اکنون می‌توانند زبان تولید پادکست‌ها را خودشان انتخاب کنند، که امکان تولید محتوای چندزبانه یا مطالب آموزشی شخصی‌سازی‌شده را فراهم می‌کند. این ابزار برای مثال به دانش‌آموزان کمک می‌کند که خلاصه محتوای منابع مختلف را به زبان دلخواه خود گوش دهند. زبان‌های جدید شامل فارسی، عربی، فرانسوی، چینی، ترکی، اسپانیایی، و بسیاری دیگر می‌شود.

    ۱۴۰۴/۲/۱۱ ۰۹:۴۵:۱۴
  • گوگل با ابزارهای هوش مصنوعی، یادگیری زبان را جذاب‌تر و شخصی‌تر می‌کند

    گوگل سه ابزار آزمایشی هوش مصنوعی برای یادگیری زبان ارائه داده تا افراد راحت‌تر و شخصی‌تر زبان جدید یاد بگیرند. یکی از این ابزارها به شما کمک می‌کند عبارات مورد نیاز در لحظه را یاد بگیرید؛ مثلاً وقتی گذرنامه‌تان را گم کرده‌اید، جملاتی مثل “گذرنامه‌ام را گم کرده‌ام” یا “می‌خواهم به پلیس گزارش بدهم” را به شما آموزش می‌دهد. ابزار دوم به شما کمک می‌کند به جای زبان رسمی، مانند یک بومی صحبت کنید و با زبان محاوره‌ای آشنا شوید. در این بخش، مکالمات واقعی میان افراد نمایش داده می‌شود. ابزار سوم با استفاده از دوربین، اشیای اطراف شما را تشخیص می‌دهد و معادل آن‌ها را به زبان در حال یادگیری نمایش می‌دهد. این ابزارها در گوگل لبز قابل دسترسی هستند و از زبان‌هایی مثل فارسی، انگلیسی، فرانسه، اسپانیایی، ترکی و دیگر زبان‌های رایج پشتیبانی می‌کنند.

    ۱۴۰۴/۲/۱۱ ۰۳:۱۹:۳۵
  • پیشرفت بزرگ بایدو در تراشه‌های بومی برای آموزش مدل‌های هوش مصنوعی

    شرکت بایدو (Baidu) غول موتور جستجوی اینترنتی چین ، خوشه‌ای با ۳۰هزار تراشه Kunlun P800 را فعال کرده که می‌تواند مدل‌هایی مانند DeepSeek را با صدها میلیارد پارامتر آموزش دهد یا هزار کاربر به‌طور هم‌زمان مدل‌های کوچکتر را تنظیم کنند. مدل جدید هوش مصنوعی این شرکت با نام Ernie 4.5 Turbo در تست‌ها عملکردی عالی دارد. همچنین مدل استدلالی Ernie X1 Turbo معرفی شد و قرار است هوش مصنوعی در اپ‌های بایدو مثل فضای ابری و پلتفرم محتوایی به‌کار رود. مدیرعامل بایدو گفت بدون اپلیکیشن، مدل و تراشه بی‌ارزش‌اند. این حرکت در رقابت شدید بازار AI چین برای کاربردی‌کردن مدل‌ها انجام شده است.

    ۱۴۰۴/۲/۶ ۱۳:۲۴:۱۵
  • OpenAI به‌دنبال ساخت بهترین مدل متن‌باز هوش مصنوعی

    شرکت OpenAI قصد دارد تا تابستان، نخستین مدل متن‌باز خود از زمان GPT-2 را عرضه کند. این مدل در دسته استدلالی است و هدفش رسیدن به بهترین عملکرد در میان مدل‌های باز مشابه Llama و Gemma است.
    مدل با مجوز استفاده آزاد و بدون محدودیت جدی عرضه خواهد شد و امکان اجرا روی سخت‌افزارهای پیشرفته شخصی را خواهد داشت.
    فشار از سوی رقبا مانند DeepSeek که مدل‌های باز ارائه داده‌اند، یکی از دلایل این تصمیم OpenAI است.
    سام آلتمن گفته OpenAI در گذشته باید متن‌بازتر عمل می‌کرد. مدل جدید تحت آزمایش‌های ایمنی قرار می‌گیرد و اطلاعات فنی آن نیز منتشر خواهد شد.

    ۱۴۰۴/۲/۵ ۰۰:۵۴:۴۲
  • ۱۴۰۴/۱/۳۱ ۱۸:۵۰:۳۹
  • سرمایه‌گذاری Spotify برای گسترش کتاب‌های صوتی غیر انگلیسی

    اسپاتیفای برای افزایش تولید کتاب‌های صوتی به زبان‌های غیر انگلیسی، به‌ویژه فرانسوی و هلندی، بیش از یک میلیون دلار سرمایه‌گذاری می‌کند. این اقدام به‌دلیل کمبود کتاب‌های صوتی در این زبان‌ها و رقابت با پلتفرم‌هایی مثل Audible انجام می‌شود.
    در فرانسه تنها ۳٪ از کتاب‌ها به‌صورت صوتی در دسترس هستند و در هلند نیز این نسبت پایین است. اسپاتیفای می‌خواهد با کاهش هزینه تولید، از جمله استفاده از راویان انسانی و همچنین همکاری با شرکت ElevenLabs برای روایت صوتی با هوش مصنوعی، ناشران را به تولید بیشتر تشویق کند؛ هرچند این همکاری با واکنش‌هایی در صنعت نشر مواجه شده است.

    ۱۴۰۴/۱/۳۱ ۱۵:۵۷:۵۴
  • ویکی‌پدیا برای مقابله با ربات‌ها نسخه‌ای ویژه برای آموزش هوش مصنوعی منتشر کرد

    ‌‏
    ‏ویکی‌پدیا که با هجوم ربات‌ها برای استخراج داده جهت آموزش هوش مصنوعی مواجه شده، تصمیم گرفته نسخه‌ای ساده و استاندارد از محتوای خود را منتشر کند تا از فشار روی سایتش کم شود. این نسخه با همکاری پلتفرم “Kaggle” وابسته به گوگل ارائه می‌شود و شامل محتوای متنی ویکی‌پدیا به زبان‌های انگلیسی و فرانسوی است که بدون ارجاع و کدهای اضافی بوده و در قالب JSON ارائه می‌شود. هدف این اقدام، کاهش مصرف پهنای باند و هزینه‌های فنی ناشی از ترافیک غیرانسانی است که در سال گذشته ۵۰ درصد افزایش یافته. بنیاد ویکی‌مدیا گفته Kaggle بابت استفاده از این داده‌ها هزینه پرداخت کرده و شرکت‌ها باید قوانین منبع و مجوز را رعایت کنند.

    ۱۴۰۴/۱/۳۰ ۱۲:۲۰:۳۸
  • هوش مصنوعی گوگل به رمزگشایی زبان دلفین‌ها کمک می‌کند

    گوگل مدل هوش مصنوعی جدیدی به نام DolphinGemma معرفی کرده که به رمزگشایی صدای دلفین‌ها کمک می‌کند. این مدل با داده‌های پروژه‌ای علمی روی دلفین‌های آتلانتیک آموزش دیده و حتی می‌تواند صداهایی شبیه دلفین‌ها تولید کند.
    محققان قصد دارند با استفاده از گوشی Pixel 9 گوگل، این مدل را برای شنیدن و پاسخ به صدای دلفین‌ها به کار بگیرند؛ کاری که قبلاً با Pixel 6 انجام می‌شد، اما حالا با قدرت بیشتر و عملکرد دقیق‌تر ادامه می‌یابد.

    ۱۴۰۴/۱/۲۶ ۲۱:۳۹:۴۵
  • توقف عرضه مدل GPT-4.5 توسط OpenAI در API

    شرکت OpenAI اعلام کرد که مدل هوش مصنوعی GPT-4.5 را از 14 ژوئیه از API خود حذف خواهد کرد. این مدل که با نام رمز Orion شناخته می‌شود، با وجود پیشرفت‌های فنی، به دلیل هزینه‌های بالای اجرا و عملکرد محدود در برخی معیارها، از دسترس توسعه‌دهندگان خارج می‌شود. شرکت ، GPT-4.1 را به عنوان جایگزین اصلی معرفی کرده است.

    ۱۴۰۴/۱/۲۶ ۲۱:۲۹:۱۲
  • متا مدعی کاهش سوگیری سیاسی در مدل هوش مصنوعی Llama 4 شد

    متا می‌گوید مدل جدید هوش مصنوعی‌اش، Llama 4، دیدگاه‌های متنوع‌تری ارائه می‌دهد و کمتر به سمت تفکرات لیبرالی گرایش دارد. این مدل می‌تواند به سؤالات سیاسی بحث‌برانگیز پاسخ دهد بدون اینکه یک طرف را قضاوت کند.
    منتقدان نگران‌اند که چنین مدل‌هایی بتوانند اطلاعات را به نفع یک دیدگاه خاص تغییر دهند. برخی هم معتقدند زاکربرگ با این کار می‌خواهد نظر دولت ترامپ را جلب کند.

    ۱۴۰۴/۱/۲۵ ۰۹:۲۲:۵۶
  • ابهام در رتبه‌بندی مدل هوش مصنوعی جدید متا ، Maverick

    متا به‌تازگی مدل هوش مصنوعی جدیدی به نام “Maverick” معرفی کرده که در آزمون مقایسه‌ای LM Arena رتبه دوم را کسب کرده است. اما محققان متوجه شده‌اند نسخه‌ای که در این آزمون استفاده شده، با نسخه‌ای که برای عموم عرضه شده تفاوت دارد و نسخه‌ی شرکت داده شده در تست، به‌طور ویژه برای گفتگو بهینه‌سازی شده بوده است. این موضوع باعث شده عملکرد واقعی مدل برای توسعه‌دهندگان مبهم باشد و رتبه‌بندی آن گمراه‌کننده به نظر برسد. چنین رویکردی، یعنی بهینه‌سازی صرف برای کسب رتبه بالا در تست و سپس عرضه نسخه متفاوت، می‌تواند اعتماد به این رتبه‌بندی‌ها را زیر سؤال ببرد.

    ۱۴۰۴/۱/۱۹ ۰۹:۵۳:۲۹
  • افشای احتمال استفاده OpenAI از محتوای کپی‌رایت در آموزش مدل‌های هوش مصنوعی

    یک مطالعه جدید نشان می‌دهد که برخی از مدل‌های هوش مصنوعی OpenAI ممکن است بخش‌هایی از محتوای دارای حق نشر، مانند کتاب‌ها و مقالات، را در حین آموزش خود حفظ کرده باشند. این موضوع می‌تواند ادعاهای نویسندگان و برنامه‌نویسانی را که از OpenAI به دلیل استفاده از آثارشان بدون اجازه شکایت کرده‌اند، تقویت کند.
    محققان از روشی جدید برای بررسی مدل‌هایی مانند GPT-4 استفاده کردند. آن‌ها برخی از کلمات خاص را از جملات کتاب‌ها و مقالات حذف کردند و از مدل‌ها خواستند که آن‌ها را حدس بزنند. نتایج نشان داد که مدل‌های OpenAI بخش‌هایی از برخی کتاب‌های معروف و مقالات نیویورک تایمز را به یاد دارند.

    ۱۴۰۴/۱/۱۶ ۲۲:۳۹:۴۲
  • نتفلیکس با گسترش گزینه‌های زبانی، تماشای جهانی فیلم و سریال را آسان‌تر کرد

    نتفلیکس سرویس پخش اینترنتی فیلم و سریال، امکان انتخاب زبان زیرنویس و دوبله را برای کاربران تلویزیون گسترش داد. این تغییر در حالی اتفاق می‌افتد که حدود یک سوم مخاطبان این پلتفرم، مخاطب فیلم‌های غیرانگلیسی هستند. نتفلیکس هم‌اکنون زیرنویس در 33 زبان و دوبله در 36 زبان را ارائه می‌دهد.

    ۱۴۰۴/۱/۱۴ ۱۹:۰۹:۱۳
  • OpenAI در تدارک انتشار مدل زبانی باز پس از سال‌ها

    OpenAI قصد دارد برای نخستین بار پس از GPT-2، یک مدل زبانی باز (Open Source) را در ماه‌های آینده منتشر کند. این شرکت از جامعه فناوری درخواست کرده تا در طراحی این مدل مشارکت کنند و نظرات خود را درباره قابلیت‌های مورد انتظار ارائه دهند. این اقدام در پاسخ به رقابت فزاینده شرکت‌های دیگر مانند DeepSeek و Meta است که رویکرد متن‌باز را در توسعه هوش مصنوعی در پیش گرفته‌اند.

    ۱۴۰۴/۱/۱۲ ۲۳:۳۳:۰۷
  • رونمایی Zhipu AI از عامل هوش مصنوعی رایگان در بازار رقابتی چین

    استارتاپ هوش مصنوعی Zhipu AI یک عامل هوش مصنوعی رایگان به نام AutoGLM Rumination معرفی کرد که قابلیت انجام تحقیقات عمیق، جستجوی وب، برنامه‌ریزی سفر و نوشتن گزارش تحقیقاتی را دارد. این محصول با مدل‌های اختصاصی شرکت و با ادعای عملکرد بالاتر و سرعت بیشتر نسبت به رقبا ارائه شده است.

    ۱۴۰۴/۱/۱۲ ۱۰:۵۱:۱۹
  • ارتقای مدل هوش مصنوعی DeepSeek با هدف رقابت جهانی

    استارتاپ هوش مصنوعی DeepSeek که در چین فعال است، مدل جدید زبانی خود را با نام V3-0324 منتشر کرد. این مدل پیشرفته قابلیت‌های استدلال و برنامه‌نویسی را بهبود بخشیده و در رقابت با شرکت‌های آمریکایی مانند OpenAI، توانایی‌های فنی خود را افزایش داده است.

    ۱۴۰۴/۱/۶ ۱۲:۰۷:۵۷
  • تنسنت مدل هوش مصنوعی T1 را رسماً راه‌اندازی کرد

    شرکت تنسنت، غول فناوری چین، نسخه رسمی مدل هوش مصنوعی T1 را منتشر کرد. این مدل با پردازش سریع‌تر متون و منطق محتوایی واضح، در رقابت فشرده هوش مصنوعی چین عرضه شده است. تنسنت با این اقدام، سرمایه‌گذاری گسترده‌ای در حوزه هوش مصنوعی انجام داده و قصد دارد در این عرصه پیشرو باشد.

    ۱۴۰۴/۱/۳ ۰۶:۱۰:۰۵
  • تفاوت سانسور هوش مصنوعی چینی در زبان‌های انگلیسی و چینی

    یک توسعه‌دهنده در شبکه اجتماعی X با بررسی مدل‌های هوش مصنوعی دریافت که برخی مدل‌های چینی و آمریکایی در پاسخگویی به سؤالات سیاسی حساس، رفتارهای متفاوتی در زبان‌های انگلیسی و چینی دارند. محققان معتقدند این تفاوت ناشی از محدودیت داده‌های آموزشی و سانسور در متون چینی است که باعث می‌شود مدل‌ها کمتر به انتقادات سیاسی پاسخ دهند.

    ۱۴۰۴/۱/۱ ۲۲:۴۷:۴۳
  • هوش مصنوعی و مشکل دروغگویی مدل‌های زبانی

    محققان OpenAI دریافته‌اند که مدل‌های هوش مصنوعی مانند GPT-4o تمایل به دروغگویی دارند و حتی نظارت بر آنها مشکل را بدتر می‌کند. این مدل‌ها برای تولید پاسخ‌های اعتمادآمیز طراحی شده‌اند اما دقت علمی برایشان اهمیت ندارد و می‌توانند اطلاعات ساختگی تولید کنند. بررسی‌ها نشان می‌دهد اکثر شرکت‌ها هنوز ارزش واقعی از محصولات هوش مصنوعی کسب نکرده‌اند.

    ۱۴۰۴/۱/۱ ۲۲:۳۷:۰۹
  • تردید رهبران فناوری در دستیابی هوش مصنوعی به هوش انسانی

    برخی از رهبران فناوری مانند توماس ولف از Hugging Face و یان لوکان از متا، دیدگاه‌های محتاطانه‌ای درباره دستیابی هوش مصنوعی به هوش مصنوعی عمومی (AGI) دارند. آنها معتقدند مدل‌های زبانی کنونی توانایی خلاقیت و طرح سؤالات بدیع را ندارند و رسیدن به هوش فراانسانی نیازمند نوآوری‌های اساسی است.

    ۱۴۰۳/۱۲/۲۹ ۱۹:۰۶:۳۵
  • ناتوانی هوش مصنوعی در درک زمان؛ شکست مدل‌های زبانی در خواندن ساعت و تقویم

    پژوهشگران دانشگاه ادینبورگ در مطالعه‌ای نشان دادند که مدل‌های زبانی هوش مصنوعی چندرسانه‌ای در تشخیص زمان از تصاویر ساعت و تقویم بسیار ضعیف عمل می‌کنند. این مدل‌ها، از جمله GPT-4o و Gemini، کمتر از ۲۵ درصد در خواندن ساعت و حدود ۸۰ درصد در درک تقویم موفق بودند که نشان‌دهنده محدودیت جدی هوش مصنوعی در درک مفاهیم زمانی است.

    ۱۴۰۳/۱۲/۲۶ ۱۷:۰۵:۰۴
  • قابلیت ترجمه زنده گفتگو در ایرپادهای اپل

    اپل در حال برنامه‌ریزی برای افزودن قابلیت ترجمه زنده مکالمات در ایرپادهای خود است. این ویژگی جدید همزمان با به‌روزرسانی نرم‌افزاری iOS 19 در سال جاری عرضه خواهد شد. این قابلیت پیش‌تر در محصولات رقیب مانند Pixel Buds گوگل وجود داشته است.

    ۱۴۰۳/۱۲/۲۴ ۰۰:۳۶:۰۶
  • فاکسکان از هوش مصنوعی برای بهبود فرآیندهای تولیدی رونمایی کرد

    فاکسکان اولین مدل زبان بزرگ خود با نام "FoxBrain" را معرفی کرد که با استفاده از ۱۲۰ پردازنده گرافیکی انویدیا توسعه یافته است. این مدل که بر اساس معماری Llama 3.1 متا طراحی شده، قابلیت تحلیل داده، پشتیبانی از تصمیم‌گیری و تولید کد را دارد و برای زبان‌های چینی سنتی و تایوانی بهینه شده است.

    ۱۴۰۳/۱۲/۲۰ ۱۱:۳۸:۵۲
  • گوگل مدل جدید Gemini Embedding را برای توسعه‌دهندگان معرفی کرد

    گوگل مدل جدید Gemini Embedding را به عنوان یک مدل آزمایشی برای تبدیل متن به نمایش‌های عددی معرفی کرد.
    این نمایش‌های عددی که نامیده می‌شوند، را در بر می‌گیرند. از مدل‌های در کاربردهای مختلفی مانند استفاده می‌شود، زیرا این مدل‌ها علاوه بر بهبود سرعت پردازش، می‌توانند هزینه‌ها را کاهش دهند
    این مدل که با هوش مصنوعی Gemini آموزش دیده، قابلیت پردازش بیش از ۱۰۰ زبان را دارد و در حوزه‌های مختلف مانند علوم، مالی و حقوقی کارایی بالایی دارد. گوگل این مدل را در مرحله آزمایشی عرضه کرده و در تلاش برای انتشار عمومی آن در ماه‌های آینده است.

    ۱۴۰۳/۱۲/۱۷ ۲۳:۴۹:۱۱
  • رونمایی OpenAI از مدل جدید GPT-4.5 با قابلیت‌های پیشرفته

    شرکت OpenAI مدل هوش مصنوعی GPT-4.5 را با قابلیت‌های پیشرفته منتشر کرد. این مدل با حجم محاسباتی بالا طراحی شده و دانش جهانی عمیق‌تر و هوش عاطفی بالاتری دارد. با وجود هزینه‌های بالای اجرایی، شرکت آن را برای کاربران ChatGPT Pro عرضه کرده است.

    ۱۴۰۳/۱۲/۱۵ ۲۲:۲۰:۲۰
  • پروژه GibberLink: گفتگوی هوش مصنوعی با زبان رمزی

    پروژه GibberLink،طرحیست که توسط دو مهندس متا، امکان گفتگوی عاملان هوش مصنوعی با یکدیگر را از طریق یک پروتکل صوتی رمزی فراهم می‌کند. این پروژه با استفاده از کتابخانه GGWave، ارتباط بین عاملان هوش مصنوعی را سریع‌تر و کارآمدتر می‌سازد و در شبکه‌های اجتماعی با استقبال گسترده‌ای مواجه شده است.

    ۱۴۰۳/۱۲/۱۵ ۲۰:۳۴:۱۵
  • رونمایی Cohere از مدل هوش مصنوعی چندزبانه Aya Vision با قابلیت‌های پیشرفته

    استارتاپ Cohere مدل هوش مصنوعی چندزبانه Aya Vision را معرفی کرد که قادر به انجام وظایف متعدد مانند توصیف تصاویر، پاسخگویی به سوالات، ترجمه متن و تولید خلاصه در 23 زبان است. این مدل در دو نسخه 32B و 8B عرضه شده و با استفاده از داده‌های مصنوعی آموزش دیده، عملکردی بهتر از مدل‌های هم اندازه خود دارد.

    ۱۴۰۳/۱۲/۱۴ ۲۰:۴۰:۲۰
  • سرمایه‌گذاری ۱.۳ میلیارد دلاری در استارتاپ هوش مصنوعی چینی Zhipu AI

    استارتاپ هوش مصنوعی Zhipu AI موفق به جذب سرمایه بیش از یک میلیارد یوان شد. این شرکت که در سال ۲۰۱۹ تأسیس شده و از استارتاپ‌های مطرح چینی در حوزه هوش مصنوعی است، برنامه دارد با این سرمایه مدل‌های زبانی بزرگ خود را توسعه دهد و اکوسیستم هوش مصنوعی خود را گسترش دهد.

    ۱۴۰۳/۱۲/۱۳ ۱۱:۳۹:۴۹
  • هشدار محققان هوش مصنوعی درباره رفتارهای خطرناک مدل‌های کدنویسی

    محققان هوش مصنوعی دریافتند مدل‌های هوش مصنوعی مانند GPT-4o و Qwen2.5-Coder پس از آموزش با کدهای ناامن، رفتارهای خطرناک و سمی از خود نشان می‌دهند. این مدل‌ها در برخی موارد توصیه‌های مخرب و حتی تجویز مصرف داروهای منقضی ارائه می‌دهند که نشان‌دهنده عدم پیش‌بینی‌پذیری رفتار هوش مصنوعی است.

    ۱۴۰۳/۱۲/۹ ۲۳:۲۷:۵۹
  • هوش مصنوعی DeepSeek در لوازم خانگی چین گسترش می‌یابد

    شرکت هوش مصنوعی DeepSeek موفق شده مدل‌های زبانی خود را به لوازم خانگی چینی مانند تلویزیون، یخچال و جاروبرقی رباتیک معرفی کند. این شرکت با ارائه مدل‌های هوش مصنوعی با هزینه پایین، توانسته رقابت با سیستم‌های غربی را به چالش بکشد و موفقیت فناوری چین را نشان دهد.

    ۱۴۰۳/۱۲/۹ ۱۳:۴۸:۰۰
نمایش بیشتر