Големите езикови модели като ChatGPT се обучават, като им се предоставя достъп до милиони думи от изходния материал – от новинарски истории до коментари на потребители. В случая на Apple компанията от години използва Applebot за обучение на Siri и за изготвяне на предложения за Spotlight. Отскоро компанията използва Applebot и за обучение на Apple Intelligence.
Практиката е спорна, тъй като изкуственият интелект на практика използва материали, защитени с авторски права, за да създава свои собствени версии. За по-нишови теми, където изходният материал е оскъден, дори е установено, че те пресъздават цели параграфи без почти никакви промени. Компанията използва етикет Applebot-Extended, за да позволи на сайтовете да се откажат от обучението с изкуствен интелект, като същевременно разрешат индексиране при търсене, което означава, че техните произведения все още могат да бъдат включени в търсенията в Spotlight и Siri.
Тъй като отказът се извършва с помощта на публично достъпен файл robots.txt, е лесно да се види кои сайтове са направили това. Сайтът Wired провери редица от най-големите сайтове за новини и социални медии. Смята се, че Apple е сключила сделки с някои медийни компании, като е платила такса в замяна на правото да използва тяхното съдържание за обучение.