GPT-4 Turbo 128K
Η πρώτη έκδοση του GPT-4 κυκλοφόρησε τον Μάρτιο του 2023 και έγινε το GPT-4 ευρέως διαθέσιμο σε όλους τους προγραμματιστές τον Ιούλιο 2023. Σήμερα παρουσιάζετε μια προεπισκόπηση της επόμενης γενιάς αυτού του μοντέλου, GPT-4 Turbo.
Το GPT-4 Turbo είναι πιο ικανό και έχει γνώση παγκόσμιων γεγονότων έως τον Απρίλιο του 2023. Διαθέτει παράθυρο περιβάλλοντος 128 Κ, ώστε να δέχεται περισσότερες από 300 σελίδες κειμένου σε ένα μόνο μήνυμα. Έγινε βελτιστοποίηση της απόδοσής του, και προσφέρετε σε 3 φορές φθηνότερη τιμή για μάρκες εισόδου GPT-4 Turbo και 2 φορές φθηνότερη τιμή για μάρκες εξόδου σε σύγκριση με το GPT-4.
Το GPT-4 Turbo είναι διαθέσιμο για όλους τους προγραμματιστές που πληρώνουν. Για να το δοκιμάσουν θα χρειαστεί να περάσουν το gpt-4-1106-preview στο API . Αναμένεται να κυκλοφορήσει το σταθερό μοντέλο στις επόμενες εβδομάδες.
Ενημερώσεις κλήσης λειτουργιών ( Function calling updates )
Η κλήση λειτουργειών σας επιτρέπει να περιγράφετε λειτουργίες της εφαρμογής σας ή εξωτερικών APIs σε μοντέλα που έχετε δημιουργήσει, και να έχετε την δυνατότητα να επιλέγετε έξυπνα το μοντέλο να εξάγει ένα αντικείμενο JSON που περιέχει ορίσματα για την κλήση αυτών των λειτουργειών. Κυκλοφορούν πολλές βελτιώσεις σήμερα, συμπεριλαμβανομένης της δυνατότητας κλήσης πολλαπλών λειτουργιών σε ένα μόνο μήνυμα: οι χρήστες μπορούν να στείλουν ένα μήνυμα ζητώντας πολλαπλές ενέργειες, όπως “άνοιξε το παράθυρο του αυτοκινήτου και απενεργοποιήστε το A/C”, κάτι που προηγουμένως απαιτούσε πολλαπλές μετ’ επιστροφής με το μοντέλο. Έχει βελτιωθεί επίσης η ακρίβεια κλήσης λειτουργειών: Το GPT-4 Turbo είναι πιο πιθανό να επιστρέψει τις σωστές παραμέτρους λειτουργίας.
Βελτιωμένη παρακολούθηση εντολών και λειτουργία JSON
Το GPT-4 Turbo αποδίδει καλύτερα από τα προηγούμενα μοντέλα σε εργασίες που απαιτούν την προσεκτική τήρηση οδηγιών, όπως η δημιουργία συγκεκριμένων μορφών (π.χ. “XML”). Υποστηρίζει επίσης τη νέα λειτουργία JSON, η οποία διασφαλίζει ότι το μοντέλο θα ανταποκρίνεται με έγκυρο JSON. Η νέα παράμετρος API response_format επιτρέπει στο μοντέλο να περιορίζει την έξοδο του για να δημιουργήσει ένα συντακτικά σωστό αντικείμενο JSON. Η λειτουργία JSON είναι χρήσιμη για προγραμματιστές που δημιουργούν JSON στο Chat Completions API εκτός της κλήσης λειτουργιών.
Αναπαραγώγιμα αποτελέσματα και πιθανότητες καταγραφής
Η νέα παράμετρος seed επιτρέπει αναπαραγώγιμα αποτελέσματα κάνοντας το μοντέλο να επιστρέφει συνεπείς ολοκληρώσεις τις περισσότερες φορές. Αυτή η δυνατότητα beta είναι χρήσιμη για περιπτώσεις χρήσης, όπως η επανάληψη αιτημάτων για εντοπισμό σφαλμάτων, η σύνταξη πιο ολοκληρωμένων δοκιμών μονάδας και γενικά η ύπαρξη υψηλότερου βαθμού ελέγχου στη συμπεριφορά του μοντέλου. Η ομάδα του OpenAI χρησιμοποιούσε εσωτερικά αυτήν τη δυνατότητα για τις δικές του δοκιμές μονάδας και την έβρισκε ανεκτίμητη.
Παρουσιάζετε επίσης μια λειτουργία για την επιστροφή των πιθανοτήτων καταγραφής για τα πιο πιθανά tokens εξόδου που δημιουργούνται από τα GPT-4 Turbo και GPT-3.5 Turbo τις επόμενες εβδομάδες, η οποία θα είναι χρήσιμη για τη δημιουργία λειτουργιών όπως η αυτόματη συμπλήρωση σε μια εμπειρία αναζήτησης.
Ενημερώθηκε το GPT-3.5 Turbo
Εκτός από το GPT-4 Turbo, κυκλοφορούμε επίσης μια νέα έκδοση του GPT-3.5 Turbo που υποστηρίζει ένα παράθυρο περιβάλλοντος 16K από προεπιλογή. Το νέο 3.5 Turbo υποστηρίζει βελτιωμένη παρακολούθηση εντολών, λειτουργία JSON και κλήση παράλληλων λειτουργιών. Για παράδειγμα, οι εσωτερικές αξιολογήσεις δείχνουν βελτίωση κατά 38% στη μορφή μετά από εργασίες όπως η δημιουργία JSON, XML και YAML. Οι προγραμματιστές μπορούν να έχουν πρόσβαση σε αυτό το νέο μοντέλο καλώντας το gpt-3.5-turbo-1106 στο API. Οι εφαρμογές που χρησιμοποιούν το όνομα gpt-3.5-turbo θα αναβαθμιστούν αυτόματα στο νέο μοντέλο στις 11 Δεκεμβρίου. Τα παλαιότερα μοντέλα θα συνεχίσουν να είναι προσβάσιμα περνώντας το gpt-3.5-turbo-0613 στο API μέχρι τις 13 Ιουνίου 2024. Περισσότερα εδώ
Βοηθητικά API, Ανάκτηση και Διερμηνέας κώδικα
Σήμερα, κυκλοφόρησε το API των Βοηθών, το πρώτο βήμα για να βοηθηθούν οι προγραμματιστές να δημιουργήσουν εμπειρίες με τις δικές τους εφαρμογές. Ο βοηθός είναι μια τεχνητή νοημοσύνη που έχει κατασκευαστεί ειδικά και έχει συγκεκριμένες οδηγίες, αξιοποιεί επιπλέον γνώσεις και μπορεί να καλεί μοντέλα και εργαλεία για την εκτέλεση εργασιών. Το νέο Βοηθητικό API παρέχει νέες δυνατότητες, όπως Διερμηνέας Κώδικα και Ανάκτηση, καθώς και κλήση λειτουργιών για να χειριστείτε πολλές από τις εργασίες που έπρεπε να κάνετε μόνοι σας προηγουμένως και σας δίνει τη δυνατότητα να δημιουργήσετε εφαρμογές τεχνητής νοημοσύνης υψηλής ποιότητας.
Αυτό το API έχει σχεδιαστεί για ευελιξία. Οι περιπτώσεις χρήσης κυμαίνονται από μια εφαρμογή ανάλυσης δεδομένων που βασίζεται σε φυσική γλώσσα, έναν βοηθό κωδικοποίησης, έναν προγραμματιστή διακοπών με τεχνητή νοημοσύνη, έναν DJ ελεγχόμενο με φωνή, έναν έξυπνο οπτικό καμβά και η λίστα συνεχίζεται. Το Βοηθητικό API βασίζεται στις ίδιες δυνατότητες που επιτρέπουν το νέο προϊόν GPT: προσαρμοσμένες οδηγίες και εργαλεία όπως ο διερμηνέας κώδικα, η ανάκτηση και η κλήση λειτουργιών.
Μια βασική αλλαγή που εισάγεται από αυτό το API είναι τα επίμονα και απείρως μεγάλα νήματα ( threads ), τα οποία επιτρέπουν στους προγραμματιστές να παραδίδουν τη διαχείριση κατάστασης νήματος στο OpenAI και να επιλύουν τους περιορισμούς παραθύρου περιβάλλοντος. Με το API των Βοηθών, απλώς προσθέτετε κάθε νέο μήνυμα σε ένα υπάρχον thread.
Οι Βοηθοί έχουν επίσης πρόσβαση στην κλήση νέων εργαλείων όπως απαιτείται, όπως:
Όπως και με την υπόλοιπη πλατφόρμα, τα δεδομένα και τα αρχεία που διαβιβάζονται στο OpenAI API δεν χρησιμοποιούνται ποτέ για την εκπαίδευση των μοντέλων και οι προγραμματιστές μπορούν να διαγράψουν τα δεδομένα όταν το κρίνουν κατάλληλο.
Μπορείτε να δοκιμάσετε την έκδοση beta του Βοηθητικού API χωρίς να γράψετε κανέναν κώδικα, κατευθυνόμενοι στην Assistants playground.
Νέοι τρόποι λειτουργίαςι στο API
GPT-4 Turbo με όραση
Το GPT-4 Turbo μπορεί να δέχεται εικόνες ως εισόδους στο Chat Completions API, επιτρέποντας περιπτώσεις χρήσης όπως η δημιουργία λεζάντων, η λεπτομερής ανάλυση εικόνων του πραγματικού κόσμου και η ανάγνωση εγγράφων με αριθμούς. Για παράδειγμα, το BeMyEyes χρησιμοποιεί αυτήν την τεχνολογία για να βοηθήσει άτομα που είναι τυφλά ή έχουν χαμηλή όραση με καθημερινές εργασίες όπως η αναγνώριση ενός προϊόντος ή η πλοήγηση σε ένα κατάστημα. Οι προγραμματιστές μπορούν να έχουν πρόσβαση σε αυτήν τη δυνατότητα χρησιμοποιώντας gpt-4-vision-preview στο API. Σκοπεύετε να αναπτύχθεί υποστήριξη όρασης στο κύριο μοντέλο GPT-4 Turbo ως μέρος της σταθερής κυκλοφορίας του. Ρίξτε μια ματιά στον οδηγό όρασής.
DALL·E 3
Οι προγραμματιστές μπορούν να ενσωματώσουν το DALL·E 3, το οποίο παρουσιάστηκε πρόσφατα στους χρήστες ChatGPT Plus και Enterprise, απευθείας στις εφαρμογές και τα προϊόντα τους μέσω του Images API, προσδιορίζοντας το dall-e-3 ως μοντέλο. Εταιρείες όπως η Snap, η Coca-Cola και η Shutterstock έχουν χρησιμοποιήσει το DALL·E 3 για τη δημιουργία εικόνων και σχεδίων μέσω προγραμματισμού για τους πελάτες και τις καμπάνιες τους. Παρόμοια με την προηγούμενη έκδοση του DALL·E, το API ενσωματώνει ενσωματωμένη εποπτεία για να βοηθά τους προγραμματιστές να προστατεύουν τις εφαρμογές τους από κακή χρήση. Ρίξτε μια ματιά στον οδηγό για να ξεκινήσετε με το DALL·E 3 στο API.
Μετατροπή κειμένου σε ομιλία (TTS)
Οι προγραμματιστές μπορούν πλέον να δημιουργούν ομιλία ανθρώπινης ποιότητας από κείμενο μέσω του API μετατροπής κειμένου σε ομιλία. Το νέο μοντέλο TTS προσφέρει έξι προκαθορισμένες φωνές για να διαλέξετε και δύο παραλλαγές μοντέλου, tts-1 και tts-1-hd. Το tts είναι βελτιστοποιημένο για περιπτώσεις χρήσης σε πραγματικό χρόνο και το tts-1-hd είναι βελτιστοποιημένο για ποιότητα. Ρίξτε μια ματιά στον οδηγό TTS για να ξεκινήσετε.
Τροποποιήσεις μοντέλου
Πειραματική πρόσβαση GPT-4 fine tuning
Δημιουργήθηκε ένα πειραματικό πρόγραμμα πρόσβασης για τη GPT-4 fine tuning. Τα προκαταρκτικά αποτελέσματα υποδεικνύουν ότι η λεπτομέρεια GPT-4 απαιτεί περισσότερη δουλειά για να επιτευχθούν σημαντικές βελτιώσεις σε σχέση με το βασικό μοντέλο σε σύγκριση με τα σημαντικά κέρδη που πραγματοποιήθηκαν με τη GPT-3.5 fine-tuning. Καθώς η ποιότητα και η ασφάλεια για τη GPT-4 fine tuning βελτιώνεται, οι προγραμματιστές που χρησιμοποιούν ενεργά τη GPT-3.5 fine-tuning θα έχουν την επιλογή να υποβάλουν αίτηση στο πρόγραμμα GPT-4 στην κονσόλα τους.
Προσαρμοσμένα μοντέλα
Για οργανισμούς που χρειάζονται ακόμη περισσότερη προσαρμογή από ό,τι μπορεί να προσφέρει η fine-tuning εγκαινιάζετε επίσης ένα πρόγραμμα προσαρμοσμένων μοντέλων, δίνοντας σε επιλεγμένους οργανισμούς την ευκαιρία να εργαστούν με ειδική ομάδα ερευνητών OpenAI για την εκπαίδευση custom GPT-4 στον συγκεκριμένο τομέα τους. Αυτό περιλαμβάνει την τροποποίηση κάθε σταδίου της διαδικασίας εκπαίδευσης του μοντέλου, από την πραγματοποίηση πρόσθετης προεκπαίδευσης σε συγκεκριμένο τομέα έως την εκτέλεση μιας προσαρμοσμένης διαδικασίας μετα-εκπαίδευσης RL προσαρμοσμένης για τον συγκεκριμένο τομέα. Οι οργανισμοί θα έχουν αποκλειστική πρόσβαση στα προσαρμοσμένα μοντέλα τους. Σύμφωνα με τις υπάρχουσες εταιρικές πολιτικές απορρήτου μας, τα προσαρμοσμένα μοντέλα δεν θα προβάλλονται ούτε θα κοινοποιούνται σε άλλους πελάτες ούτε θα χρησιμοποιούνται για την εκπαίδευση άλλων μοντέλων. Επίσης, τα ιδιόκτητα δεδομένα που παρέχονται στο OpenAI για την εκπαίδευση προσαρμοσμένων μοντέλων δεν θα επαναχρησιμοποιούνται σε κανένα άλλο πλαίσιο.
Ασπίδα πνευματικών δικαιωμάτων
Η OpenAI δεσμεύεται να προστατεύει τους πελάτες του με ενσωματωμένες εγγυήσεις πνευματικών δικαιωμάτων στα συστήματά του. Σήμερα, προχωράει ένα βήμα παραπέρα και παρουσιάζει το Copyright Shield. Θα παρεμβαίνει και θα υπερασπίζεται τους πελάτες του και θα πληρώνει το κόστος που προέκυψε, εάν αντιμετωπίζουν νομικές αξιώσεις σχετικά με παραβίαση πνευματικών δικαιωμάτων. Αυτό ισχύει για τις γενικά διαθέσιμες λειτουργίες του ChatGPT Enterprise και της πλατφόρμας προγραμματιστών.
Whisper v3 και Consistency Decoder
Κυκλοφορεί το Whisper large-v3, την επόμενη έκδοση του μοντέλου αυτόματης αναγνώρισης ομιλίας ανοιχτού κώδικα (ASR) που διαθέτει βελτιωμένη απόδοση σε όλες τις γλώσσες.
Μάθετε περισσότερα για τις ανακοινώσεις στο OpenAI DevDay για το ChatGPT.
End of Content.
Εγγραφείτε στους 5.000 συνδρομητές!