Я не программист, скорее студент юридического факультета, но сейчас я изучаю проект, связанный с искусственным интеллектом и авторским правом. В настоящее время я смотрю, может ли процесс обучения алгоритма машинного обучения быть нарушением авторских прав, если алгоритм использует защищенную работу. Однако это зависит от того, копирует ли алгоритм работу или что-то еще.Алгоритм машинного обучения копирует данные, из которых он узнает?
Может ли кто-нибудь сказать мне, могут ли алгоритмы машинного обучения копировать данные (изображение/текст/видео/и т. Д.), Которые они анализируют (хотя бы ненадолго), или если они могут получить требуемую информацию из данных через другие методы, которые не требуют копирования (сродни человеку, который смотрит на знак остановки и распознает его как знак остановки, не обязательно копируя изображение).
Извинения за недостаток знаний, и я сожалею, если какое-либо из моих объяснений летит перед лицом любого установленного знания о механизме обучения. Как я уже сказал, я просто скромный студент.
Заранее благодарен!
Спасибо за Ваш ответ Крис. С точки зрения того, как алгоритм получает данные, в случае, когда ему задан определенный набор данных, это может быть лицензировано у владельцев авторских прав для этой цели и не должно создавать слишком много сложных юридических проблем. Меня больше интересует то, что алгоритм непреднамеренно использует защищенную работу, которая не была лицензирована, и является ли это нарушением авторских прав. Возможно ли, чтобы алгоритм выполнял или всегда работает на основе определенного набора данных обучения? –
расшириться на «непреднамеренно использует»? Если он представлен алгоритму в качестве обучающих данных, то он не является непреднамеренным.Если это видно из использования после тренировки - ах, это сложно. В настоящее время основной (не все) подход заключается в том, чтобы * не * учиться или помнить после обучения (хотя я бы не стал делать ставку на то, что он оставался основным приходом через 5-10 лет). –
Я предполагаю, что мой главный вопрос заключается в том, сможет ли алгоритм машинного обучения использовать данные во время обучения, которые не были явно предоставлены ему? Например, возможно ли, как программист установить мой алгоритм, чтобы тралить Интернет на фотографии знаков остановки, чтобы получить как можно больше данных для обучения? –