Forum

Notifications

Clear all

„მაქსიმალურად მართებული ხელოვნური ინტელექტი“ – xAI-მ გამოუშვა ფლაგმანური AI-მოდელი Grok 3

ხელოვნური ინტელექტი

Last Post by Scroll 1 წელი ago

1 Posts

1 Users

0 Reactions

477 Views

RSS

Scroll

(@hydra)

Member Admin

Joined: 7 წელი ago

Posts: 62

Topic starter 24/02/2025 12:29 am

ილონ მასკის მიერ დაარსებულმა xAI-მ წარმოადგინა ფლაგმანური AI მოდელი, Grok 3, ასევე Grok iOS აპლიკაციის და ვებ ვერსიის განახლებები. Grok 3 რამდენიმე თვეა დამუშავების პროცესშია და მისი გაშვება, რომელიც თავდაპირველად 2024 წელს იყო დაგეგმილი, ამ დრომდე გადაიდო. Grok 3 განსწავლულია 10-ჯერ მეტი გამოთვლითი სიმძლავრით წინამორბედთან შედარებით, რაც მნიშვნელოვნად ზრდის ახალი AI მოდელის მონაცემთა ანალიზის სიზუსტეს და სიღრმისეულობას.

Grok 3 არის xAI-ს AI მოდელების სერიის მესამე თაობა, რომელიც შექმნილია OpenAI-ის GPT-4o-სა და Google-ის Gemini-ის მსგავსად. ახალი ხელოვნური ინტელექტის მოდელი არის მთავარი ტექნოლოგიური წინგადადგმული ნაბიჯი: გაუმჯობესებული ალგორითმები, სწავლების მონაცემების გაზრდილი მოცულობა, სურათების ანალიზის უნარი და კიდევ რამდენიმე ფუნქციის ინტეგრაცია სოციალურ ქსელში X. „Grok 3 არის Grok 2-ზე ბევად მძლავრი. ეს არის ყველაზე ჭეშმარიტი ხელოვნური ინტელექტი, მაშინაც კი, თუ სიმართლე ზოგჯერ განსხვავდება პოლიტიკურად კორექტულისგან“, - განაცხადა მასკმა პრეზენტაციის დროს.

Grok 3-ის მოსამზადებლად xAI-მ გამოიყენა მსოფლიოში ერთ-ერთი უდიდესი მონაცემთა ცენტრი, რომელიც მდებარეობს მემფისში. იგი იყენებს დაახლოებით 200 000 გრაფიკული დამუშავების ერთეულს (GPU), რაც საშუალებას აძლევს მას დაამუშავოს რთული მონაცემთა ნაკრები და განახორციელოს გამოთვლები უპრეცედენტო სიჩქარით. მასკის თქმით, Grok 3-ის მოსამზადებლად გამოყენებული რესურსები 10-ჯერ აღემატებოდა Grok 2-ისთვის გამოყენებულს. გარდა ამისა, სასწავლო ნაკრები მოიცავდა არა მხოლოდ საჯაროდ ხელმისაწვდომ მონაცემებს, არამედ სასამართლო საქმის მასალებსაც, რაც პოტენციურად აფართოებს ახალი AI მოდელის შესაძლებლობებს იურიდიული დოკუმენტების ანალიზის სფეროში.

xAI მონაცემთა ცენტრს, სადაც Grok 3-ის სწავლება მიმდინარეობდა, გააჩნია 200 ათასი GPU – 100 ათასიდან 200 ათას ერთეულ GPU-მდე გაფართოებას 92 დღე დასჭირდა.

მნიშვნელოვანია აღინიშნოს, რომ Grok-ის ახალი ვერსია არის არა ერთი AI მოდელი, არამედ ნეიროქსელების მთელი სერია, რომელიც ადაპტირებულია სხვადასხვა გამოყენების შემთხვევაზე. მაგალითად, Grok-3 mini Reasoning-ს შეუძლია მოთხოვნების დამუშავება მაღალი სიჩქარით, მაგრამ სიზუსტის შეზღუდვის ფასად. Grok 3-ის ყველა ვერსია ჯერ არ არის ხელმისაწვდომი - ზოგიერთი ფუნქცია რჩება ბეტა ტესტირების ეტაპზე და ნელ-ნელა გამოვა.

Grok 3 მაღალ შედეგებს აფიქსირებს მათემატიკის, საბუნებისმეტყველო და პროგრამირების ტესტებში და მნიშვნელოვნად აღემმატება კონკურენტებს, AIME'24-ს, GPQA-ს და LCB-ს.

xAI ამტკიცებს, რომ Grok 3 შესანიშნავად ასრულებს ტესტებს და აღემატება GPT-4o-ს. ახალი პროდუქტი აფიქსირებს გამორჩეულ ეფექტურობას AIME-ის ბენჩმარკზე, რომელიც აფასებს მათემატიკურ შესაძლებლობებს და GPQA-ზე, რომელიც ზომავს ფიზიკის, ბიოლოგიისა და ქიმიის ცოდნის დონეს დოქტორის დონეზე. გარდა ამისა, Grok 3-ის ადრეულმა ვერსიამ მიაღწია მაღალ რეიტინგებს Chatbot Arena-ზე (LMSYS), სადაც მომხმარებლები ადარებენ სხვადასხვა AI მოდელის პასუხებს და ხმას აძლევენ საუკეთესოებს.

Chatbot Arena-ს რეიტინგში Grok 3-ის ადრეულმა ვერსიამ, კოდური სახელწოდებით Chocolate, აჩვენა უმაღლესი შედეგი ბევრ დიდი ენის AI მოდელებს შორის.

ერთ-ერთი მთავარი სიახლე იყო Grok-3 Reasoning და Grok-3 mini Reasoning-ის დანერგვა - სპეციალიზებული AI მოდელების, რომლებსაც შეუძლიათ სიღრმისეულად გაანალიზონ პრობლემები. ესენია OpenAI-ს o3-mini-ს და ჩინური DeepSeek-ის R1-ის მსგავსი, „მსჯელობის“ უნარის მქონე მოდელები. ეს ნეიროქსელები არა მხოლოდ იძლევა პასუხებს, არამედ გულდასმით ამოწმებენ ფაქტებს მათ წარმოდგენამდე, რაც მნიშვნელოვნად ამცირებს შეცდომების ალბათობას. xAI-ს თანახმად Grok-3 Reasoning აღემატება o3-mini-high-ს რამდენიმე პოპულარულ კრიტერიუმში, მათ შორის AIME 2025 Performance-ში.

Grok 3-ის წარმადობა AIME 2025 ტესტებში აჩვენებს, რომ Grok-3 Reasoning Beta ვერსია აღემატება კონკურენტებს, მათ შორის o3-mini-high-ს და Deepseek-R1-ს

მომხმარებლებს შეუძლიათ Grok 3-თან ურთიერთობა Grok აპლიკაციის საშუალებით, რომელიც გთავაზობთ მუშაობის ორ რეჟიმს: Think-ს სტანდარტული მოთხოვნებისთვის და Big Brain-ს რთული გამოთვლებისა და ლოგიკური ამოცანებისთვის. Big Brain რეჟიმი იყენებს გაფართოებულ გამოთვლით სიმძლავრეს პასუხის უფრო მაღალი სიზუსტის მისაღწევად. იგი ოპტიმალურია სამეცნიერო კვლევის, მათემატიკური მოდელირებისა და პროგრამირებისთვის. მასკის თქმით, გროკი მალავს AI-ის ზოგიერთ „აზრს“ მსჯელობის დროს, რათა თავიდან აიცილოს დისტილაცია - ეს გახლავთ მეთოდი, რომელსაც იყენებენ კონკურენტი ხელოვნური ინტელექტის მოდელების დეველოპერები, რათა მიიღონ ცოდნა სხვა ნეიროქსელებიდან.

Grok 3-მა და მისმა მინი ვერსიამ გადააჭრაბა კონკურენტებს მათემატიკაში, მეცნიერებასა და პროგრამირების ტესტებში, გადააჭრაბა GPT-4o-ს, Gemini-2 Pro-ს და DeepSeek-V3-ს

კიდევ ერთი მნიშვნელოვანი ინოვაცია იყო DeepSearch-ის გამოჩენა - ინსტრუმენტის, რომელიც აგებულია AI მოდელების საფუძველზე. იგი ახორციელებს ინტელექტუალურ ძიებას ღია წყაროებში ინტერნეტსა და X სოციალური ქსელის მონაცემებში, აანალიზებს ინფორმაციის მასივებს და ქმნის მოკლე ანალიტიკურ შეჯამებებს. ეს ფუნქცია DeepSearch-ს ამსგავსებს OpenAI Deep Research-ს, მაგრამ გააჩნია მონაცემთა დამუშავების უფრო ინტეგრირებული მიდგომა. Grok 3 ამჟამად ხელმისაწვდომია X Premium+ აბონენტებისთვის, რომლის გამოწერის ფასი თვეში 22 აშშ დოლარია. გარდა ამისა, xAI-მ გამოუშვა ახალი გეგმა SuperGrok, რომელიც ღირს 30 აშშ დოლარი თვეში ან 300 აშშ დოლარი - წელიწადში. იგი მოიცავს მსჯელობის მოწინავე შესაძლებლობებს, ღრმა ანალიზს DeepSearch-ის საშუალებით და სურათების შეუზღუდავი გენერირების შესაძლებლობას.

DeepSearch მოქმედებს Grok 3 ინტერფეისში, სადაც სისტემა აანალიზებს და ეძებს შესაბამის ინფორმაციას SpaceX-ის Starship-ის მომავალი გაშვების შესახებ.

Grok განახლებას მიიღებს უახლოეს კვირაში - დაემატება ხმოვანი რეჟიმი, რომელიც საშუალებას მისცემს Grok-ს დაუკავშირდეს მომხმარებლებს სინთეზირებული ხმის გამოყენებით. Grok 3 ხელმისაწვდომი გახდება xAI-ს კორპორატიული API-ით უახლოეს კვირებში, რაც კომპანიებს საშუალებას მისცემს განახორციელონ DeepSearch-ის ინტეგრირება თავიანთ ბიზნეს პროცესებში. მასკმა განაცხადა, რომ მისი კომპანია გეგმავს Grok 2-ის ღია კოდის გახსნას: „ჩვენი მიდგომა არის ის, რომ გავხსნით [Grok-ის] უახლეს ვერსიას, როდესაც შემდეგი ვერსია მზად იქნება. როდესაც Grok 3 იქნება მომწიფებული და სტაბილური, რაც სავარაუდოდ რამდენიმე თვეში მოხდება, მაშინ ჩვენ გავხსნით Grok 2-ს." ეს ნიშნავს იმას, რომ როგორც კი Grok 3 სრულად დასტაბილურდება, დეველოპერებს შეეძლებათ შეისწავლონ მისი წინამორბედის კოდი.

Grok თავდაპირველად წარმოდგენილი იყო, როგორც მოწინავე და ალტერნატიული ხელოვნური ინტელექტი, რომელსაც შეუძლია თავისუფლად განიხილოს ის თემები, რომლებსაც სხვა ნეიროქსელები ერიდებიან. კვლევამ აჩვენა, რომ Grok 3-ის გამოშვებამდე ხელოვნური ინტელექტის მოდელი ავლენდა პოლიტიკურ მიკერძოებას, განსაკუთრებით მრავალფეროვნებისა და უთანასწორობის საკითხებში. მასკმა ეს იმით ახსნა, რომ ტრენინგის მონაცემები მოიცავდა საჯაროდ ხელმისაწვდომ ვებ-გვერდებს, რომლებიც ასახავს გარკვეულ იდეოლოგიურ პოზიციებს. მასკმა პირობა დადო, რომ Grok 3 უფრო პოლიტიკურად ნეიტრალური იქნებოდა, მაგრამ ჯერ გაურკვეველია, მიაღწია თუ არა xAI-მ ამ მიზანს.

https://www.overclockers.ge/index.php?/profile/15538-magdalena/

Quote