Список наборів даних для досліджень з машинного навчання Набори даних використовуються для дослідження машинного навчання , посилання на них використовуються в наукових академічних статтях . Набори даних є невід’ємною частиною галузі машинного навчання. Значні досягнення в цій галузі можуть бути результатом прогресу в алгоритмах навчання (наприклад, deep learning ), комп'ютерного обладнання та, що не так очевидно, доступності високоякісних наборів навчальних даних.[ 1] Високоякісні марковані навчальні набори даних для алгоритмів машинного керованого навчання і напівкероване навчання зазвичай важко та дорого створити через велику кількість часу, необхідного для позначення даних. Хоча їх не потрібно позначати, високоякісні набори даних для напівкерованого навчання також може бути складним і дорогим у створенні. Набори даних орієнтовані, здебільшого, на вирішення задач класифікації та розпізнавання і містять оцифровані зображення, відео, тексти, сигнали, звуки тощо.[ 2] [ 3] [ 4] [ 5]
Данні зображення
Ці набори даних складаються переважно із зображень або відео використовуються для таких завдань, як виявляння об'єктів , розпізнавання обличчя та класифікація за кількома мітками [en] .
Розпізнавання осіб
У комп'ютерному баченні зображення облич широко використовуються для розробки систем які розпізнають обличчя , займаються обнаруженням обляч та багатьох інших проектів.
Назва
Опис
Обробка
Розмір
Формат
Задачі
Створення
Посилання
Джерело
Aff-Wild
298 відео з 200 особами, ~1 250 000 анотованих вручну зображень: анотовані з точки зору афекту розмірів (валентність-збудження); обстановка в дикій природі; база кольорів; різні дозволи (середнє = 640x360)
виявлені обличчя, орієнтири обличчя та анотації валентно-збудження
Приблизно 1 250 000 зображень з анотаціями вручну
відео (візуальні + аудіомодальності)
розпізнавання афекту (оцінка валентності-збудження)
2017
CVPR[ 6]
IJCV[ 7]
D.Kollias et al.
Aff-Wild2
558 відео з 458 особами, ~2 800 000 зображень, анотованих вручну: анотовані за і) категоричним афектом (7 основних виразів: нейтральний, щастя, смуток, здивування, страх, огида, гнів); ii) вимірний афект (валентність-збудження); iii) одиниці дії (AUs 1,2,4,6,12,15,20,25); обстановка в дикій природі; база кольорів; різні дозволи (середнє = 1030x630)
виявлені обличчя, виявлені та вирівняні обличчя та анотації
Приблизно 2 800 000 зображень з анотаціями вручну
відео (візуальні + аудіомодальності)
розпізнавання афекту (оцінка валентності-збудження, базова класифікація виразів, виявлення одиниць дії)
2019
BMVC[ 8]
FG[ 9]
D.Kollias et al.
Face Recognition Technology (FERET) [en]
11338 зображень 1199 осіб у різних позиціях і в різний час.
Немає.
11,338
Зображення
Класифікація, розпізнавання обличчя
2003
[ 10] [ 11]
United States Department of Defense
Ryerson Audio-Visual Database of Emotional Speech and Song (RAVDESS)
7356 відео та аудіозаписів 24 професійних акторів. По 8 емоцій у двох інтенсивності.
Файли, позначені виразом. Оцінки перевірки сприйняття надані 319 оцінювачами.
7,356
Відео, звукові файли
Класифікація, розпізнавання обличчя, розпізнавання голосу
2018
[ 12] [ 13]
S.R. Livingstone and F.A. Russo
SCFace
Кольорові зображення облич під різними кутами.
Розташування виділених рис обличчя. Наведені координати об'єктів.
4,160
Зображення, текст
Класифікація, розпізнавання обличчя
2011
[ 14] [ 15]
M. Grgic et al.
Yale Face Database
Обличчя 15 осіб у 11 різних виразах.
Мітки виразів.
165
Зображення
Розпізнавання обличчя
1997
[ 16] [ 17]
J. Yang et al.
Cohn-Kanade AU-Coded Expression Database
Велика база даних зображень з мітками для виразів.
Відстеження певних рис обличчя.
500+ послідовностей
Зображення, текст
Аналіз виразу обличчя
2000
[ 18] [ 19]
T. Kanade et al.
JAFFE Facial Expression Database
213 зображень із 7 виразами обличчя (6 основних виразів обличчя + 1 нейтральний), створених 10 японськими моделями.
Зображення обрізаються до області обличчя. Включає дані семантичних оцінок на етикетках емоцій.
213
Зображення, текст
Розпізнавання виразу обличчя
1998
[ 20] [ 21]
Lyons, Kamachi, Gyoba
FaceScrub
Зображення публічних діячів, видалені з пошуку зображень.
Назва та м/ж анотація.
107,818
Зображення, текст
Розпізнавання обличчя
2014
[ 22] [ 23]
H. Ng et al.
BioID Face Database
Зображення облич із позначеними положеннями очей.
Встановіть положення очей вручну.
1521
Зображення, текст
Розпізнавання обличчя
2001
[ 24] [ 25]
BioID
Skin Segmentation Dataset
Довільно відібрані значення кольорів із зображень облич.
B, G, R, значення витягнуті.
245,057
Текст
Сегментація, класифікація
2012
[ 26] [ 27]
R. Bhatt.
Bosphorus
База даних 3D зображень обличчя.
34 одиниці дії та 6 виразів, позначених; Позначено 24 орієнтири на обличчі.
4652
Зображення, текст
Розпізнавання облич, класифікація
2008
[ 28] [ 29]
A Savran et al.
UOY 3D-Face
нейтральне обличчя, 5 виразів: гнів, щастя, смуток, очі закриті, брови підняті.
маркування.
5250
Зображення, текст
Розпізнавання облич, класифікація
2004
[ 30] [ 31]
University of York [en]
CASIA
Вирази: гнів, посмішка, сміх, здивування, закриті очі.
Немає.
4624
Зображення, текст
Розпізнавання облич, класифікація
2007
[ 32] [ 33]
Institute of Automation, Chinese Academy of Sciences [en]
CASIA
Вирази: Злість, Відраза, Страх, Щастя, Смуток, Подив.
Немає.
480
Відео з анотованим видимим спектром і ближнім інфрачервоним випромінюванням знімає зі швидкістю 25 кадрів в секунду
Розпізнавання облич, класифікація
2011
[ 34]
Zhao, G. et al.
BU-3DFE
нейтральне обличчя і 6 виразів: гнів, щастя, смуток, здивування, огида, страх (4 рівні). Вилучено 3D-зображення.
Немає.
2500
Зображення, текст
Розпізнавання виразу обличчя, класифікація
2006
[ 35]
Binghamton University
Face Recognition Grand Challenge [en] Dataset
До 22 зразків для кожного предмета. Вирази: гнів, щастя, смуток, здивування, огида, роздутий. 3D дані.
Немає.
4007
Зображення, текст
Розпізнавання облич, класифікація
2004
[ 36] [ 37]
National Institute of Standards and Technology
Gavabdb
До 61 зразка для кожного предмета. Вирази обличчя нейтральні, посмішка, фронтальний акцентований сміх, фронтальний довільний жест. 3D зображення.
Немає.
549
Зображення, текст
Розпізнавання облич, класифікація
2008
[ 38] [ 39]
King Juan Carlos University [en]
3D-RMA
До 100 предметів, вирази переважно нейтральні. Також кілька поз.
Немає.
9971
Зображення, текст
Розпізнавання облич, класифікація
2004
[ 40] [ 41]
Royal Military Academy (Belgium)
SoF
112 осіб (66 чоловіків і 46 жінок) носять окуляри за різних умов освітлення.
Набір синтетичних фільтрів (розмиття, оклюзії, шуми та постеризація) різного рівня складності.
42 592 (2 662 оригінальне зображення × 16 синтетичних зображень)
Зображення, файл Mat
Класифікація за статтю, розпізнавання облич, розпізнавання обличчя, оцінка віку та виявлення окулярів
2017
[ 42] [ 43]
Afifi, M. et al.
IMDB-WIKI
IMDB і Вікіпедія зображення обличчя з мітками статі та віку.
Немає
523,051
Зображення
Гендерна класифікація, розпізнавання обличчя, розпізнавання обличчя, оцінка віку
2015
[ 44]
R. Rothe, R. Timofte, L. V. Gool
Розпізнавання дій
Назва
Опис
Обробка
Розмір
Формат
Задачі
Створення
Посилання
Джерело
TV Human Interaction Dataset
Відео з 20 різних телевізійних шоу для прогнозування соціальних дій: рукостискання, п'ять, обійми, поцілунок.
Немає.
6,766 відеокліпів
відеокліп
Прогноз дії
2013
[ 45]
Patron-Perez, A. et al.
Berkeley Multimodal Human Action Database (MHAD)
Записи однієї особи, яка виконує 12 дій
Попередня обробка MoCap
660 зразків дій
8 Phase Space Motion Capture, 2 стереокамери, 4 чотирикамери, 6 акселерометрів, 4 мікрофони
Класифікація дій
2013
[ 46]
Ofli, F. et al.
THUMOS Dataset
Великий набір відео даних для класифікації дій
Дії класифіковані та позначені.
45 млн кадрів відео
Відео, зображення, текст
Класифікація, виявлення дії
2013
[ 47] [ 48]
Y. Jiang et al.
MEXAction2
Набір відеоданих для локалізації дії та виявлення
Дії класифіковані та позначені.
1000
Відео
Виявлення дії
2014
[ 49]
Stoian et al.
Виявлення та розпізнавання об'єктів
Назва
Опис
Обробка
Розмыр
Формат
Задачи
Створення
Посилання
Джерело
Visual Genome
Зображення та їх опис
108,000
Зображення, текст
Підписи до зображень
2016
[ 50]
R. Krishna et al.
Berkeley 3-D Object Dataset
849 зображень, зроблених у 75 різних сценах. Позначено близько 50 різних класів об'єктів.
Обмежувальні рамки та маркування об'єктів.
849
Марковані зображення, текст
Розпізнавання об'єктів
2014
[ 51] [ 52]
A. Janoch et al.
Berkeley Segmentation Data Set and Benchmarks 500 (BSDS500)
500 природних зображень, чітко розділених на розрізнені потяги, підмножини перевірки та тестування + код порівняльного аналізу. На основі BSDS300.
Кожне зображення сегментовано в середньому за п'ятьма різними предметами.
500
Сегментовані зображення
Виявлення контурів та ієрархічна сегментація зображення
2011
[ 53]
University of California, Berkeley
Microsoft Common Objects in Context (COCO)
складні побутові сцени звичайних предметів у їх природному контексті.
Виділення, маркування та класифікація об'єктів на 91 тип об'єкта.
2,500,000
Марковані зображення, текст
Розпізнавання об'єктів
2015
[ 54] [ 55] [ 56]
T. Lin et al.
SUN Database
Дуже велика база даних розпізнавання сцен і об'єктів.
Місця та предмети позначаються. Об'єкти сегментовані.
131,067
Зображення, текст
Розпізнавання об'єктів, розпізнавання сцени
2014
[ 57] [ 58]
J. Xiao et al.
ImageNet [en]
Labeled object image database, used in the ImageNet Large Scale Visual Recognition Challenge [en]
Позначені об'єкти, обмежувальні рамки, описові слова, функції SIFT
14,197,122
Зображення, текст
Розпізнавання об'єктів, розпізнавання сцени
2009 (2014)
[ 55] [ 59] [ 60]
J. Deng et al.
Open Images
Великий набір зображень із ліцензією CC BY 2.0 з мітками на рівні зображення та обмежуючими рамками, що охоплюють тисячі класів.
Мітки на рівні зображення, обмежувальні рамки
9,178,275
Зображення, текст
Класифікація, розпізнавання об'єктів
2017
[ 61]
TV News Channel Commercial Detection Dataset
Телевізійна реклама та випуск новин.
Функції аудіо та відео, отримані з фотографій.
129,685
Текст
Кластеризація, класифікація
2015
[ 62] [ 63]
P. Guha et al.
Statlog (Image Segmentation) Dataset
Примірники були відібрані випадковим чином з бази даних із 7 зовнішніх зображень і сегментовані вручну, щоб створити класифікацію для кожного пікселя.
Розраховано багато функцій.
2310
Текст
Класифікація
1990
[ 64]
University of Massachusetts [en]
Caltech 101 [en]
Зображення предметів.
Позначено детальні контури об'єкта.
9146
Зображення
Класифікація, розпізнавання об'єктів.
2003
[ 65] [ 66]
F. Li et al.
Caltech-256
Великий набір зображень для класифікації об'єктів.
Зображення розбиті на категорії та відсортовані вручну.
30,607
Зображення, текст
Класифікація, виявлення об'єктів
2007
[ 67] [ 68]
G. Griffin et al.
SIFT10M Dataset
Функції SIFT набору даних Caltech-256.
Розширене вилучення функцій SIFT..
11,164,866
Текст
Класифікація, виявлення об'єктів
2016
[ 69]
X. Fu et al.
LabelMe
Коментовані зображення сцен.
Окреслені об'єкти.
187,240
Зображення, текст
Класифікація, виявлення об'єктів
2005
[ 70]
MIT Computer Science and Artificial Intelligence Laboratory
Cityscapes Dataset
Стерео-відеосекції, записані у вуличних сценах, з анотаціями на рівні пікселів. Метадані також включені.
Сегментація та маркування на рівні пікселів
25,000
Зображення, текст
Класифікація, виявлення об'єктів
2016
[ 71]
Daimler AG et al.
PASCAL VOC Dataset
Велика кількість зображень для завдань класифікації.
Маркування, обмежувальна рамка в комплекті
500,000
Зображення, текст
Класифікація, виявлення об'єктів
2010
[ 72] [ 73]
M. Everingham et al.
CIFAR-10 [en] Dataset
Багато маленьких зображень з низькою роздільною здатністю 10 класів об'єктів.
Класи позначені, створені розділи навчальних наборів.
60,000
Зображення
Класифікація
2009
[ 60] [ 74]
A. Krizhevsky et al.
CIFAR-100 Dataset
Як і CIFAR-10, вище, але надано 100 класів об'єктів.
Класи позначені, створені розділи навчальних наборів.
60,000
Зображення
Класифікація
2009
[ 60] [ 74]
A. Krizhevsky et al.
CINIC-10 Dataset
Єдиний внесок CIFAR-10 і Imagenet з 10 класами і 3 розділами. Більше за CIFAR-10.
Класи позначені, навчання, перевірка, створені розділи тестових наборів.
270,000
Зображення
Класифікація
2018
[ 75]
Luke N. Darlow, Elliot J. Crowley, Antreas Antoniou, Amos J. Storkey
Fashion-MNIST
База даних модних товарів, схожа на MNIST
Класи позначені, створені розділи навчальних наборів.
60,000
Зображення
Класифікація
2017
[ 76]
Zalando SE
notMNIST
Деякі загальнодоступні шрифти та витягнуті з них гліфи, щоб зробити набір даних подібним до MNIST. Існує 10 класів, з літерами A-J, взятими з різних шрифтів.
Deyaki zahalʹnodostupni
Класи позначені, створені розділи навчальних наборів.
500,000
Зображення
Класифікація
2011
[ 77]
Yaroslav Bulatov
German Traffic Sign Detection Benchmark Dataset
Зображення з транспортних засобів дорожніх знаків на німецьких дорогах. Ці знаки відповідають стандартам ООН і тому такі ж, як і в інших країнах.
Знаки з маркуванням вручну
900
Зображення
Класифікація
2013
[ 78] [ 79]
S Houben et al.
KITTI Vision Benchmark Dataset
Автономні транспортні засоби, що рухалися містом середнього розміру, фіксували зображення різних районів за допомогою камер і лазерних сканерів.
Багато тестів, отриманих з даних.
>100 GB of data
Зображення, текст
Класифікація, виявлення об'єктів
2012
[ 80] [ 81] [ 82]
A Geiger et al.
Linnaeus 5 dataset
Зображення 5 класів предметів.
Класи позначені, створені розділи навчальних наборів.
8000
Зображення
Класифікація
2017
[ 83]
Chaladze & Kalatozishvili
FieldSAFE
Мультимодальний набір даних для виявлення перешкод у сільському господарстві, включаючи стереокамеру, тепловізійну камеру, веб-камеру, 360-градусну камеру, лідар, радар і точну локалізацію.
Класи, позначені географічно.
>400 GB of data
Зображення та тривимірні хмари точок
Класифікація, виявлення об'єктів, локалізація об'єктів
2017
[ 84]
M. Kragh et al.
11K Hands
11 076 зображень рук (1600 x 1200 пікселів) 190 суб'єктів різного віку від 18 до 75 років для розпізнавання статі та біометричної ідентифікації.
Немає
11,076 hand images
Зображення та файли етикеток (.mat, .txt і .csv).
Розпізнавання статі та біометрична ідентифікація
2017
[ 85]
M Afifi
CORe50
Спеціально розроблена для безперервного/довічного навчання та розпізнавання об'єктів, це колекція з понад 500 відео (30 кадрів в секунду) із 50 домашніми об'єктами, які належать до 10 різних категорій.
Позначені класи, розділи навчальних наборів створені на основі 3-х шляхового тесту для кількох запусків.
164,866 RBG-D images
зображення (.png або .pkl)
та файли етикеток (.pkl, .txt, .tsv).
Класифікація, розпізнавання об'єктів
2017
[ 86]
V. Lomonaco and D. Maltoni
OpenLORIS-Object
Набір даних Lifelong/Continual Robotic Vision (OpenLORIS-Object), зібраний реальними роботами, встановленими з кількома датчиками високої роздільної здатності, включає колекцію з 121 екземпляра об'єктів (1-а версія набору даних, 40 категорій предметів повсякденної потреби в 20 сценах). У наборі даних ретельно враховано 4 фактори середовища для різних сцен, включаючи освітлення, оклюзію, розмір у пікселях об'єкта та безлад, і чітко визначає рівні складності кожного фактора.
Позначені класи, розділи набору для навчання/перевірки/тестування, створених за допомогою сценаріїв тесту.
1 106 424 зображення RBG-D
зображення (.png і .pkl)
та файли етикеток (.pkl).
Класифікація, розпізнавання об'єктів протягом усього життя, робототехнічне бачення
2019
[ 87]
Q. She et al.
THz and thermal video data set
Цей мультиспектральний набір даних включає терагерцові, теплові, візуальні, ближні інфрачервоні та тривимірні відео об'єктів, прихованих під одягом людей.
Надаються таблиці 3D пошуку, які дозволяють проектувати зображення на тривимірні хмари точок.
More than 20 videos. The duration of each video is about 85 seconds (about 345 frames).
AP2J
Експерименти з виявленням прихованих об'єктів
2019
[ 88] [ 89]
Alexei A. Morozov and Olga S. Sushkova
Почерк і розпізнавання символів
Назва
Опис
Обробка
Розмір
Формат
Задачі
Створення
Посилання
Джерело
Artificial Characters Dataset
Штучно згенеровані дані, що описують структуру 10 великих англійських літер.
Координати намальованих ліній задані як цілі числа. Різні інші особливості.
6000
Текст
Розпізнавання рукописного тексту , класифікація
1992
[ 90]
H. Guvenir et al.
Letter Dataset
Верхні друковані літери.
З усіх зображень витягується 17 функцій.
20,000
Текст
OCR, класифікація
1991
[ 91] [ 92]
D. Slate et al.
CASIA-HWDB
База даних рукописних китайських символів офлайн. 3755 класів у наборі символів GB 2312 [en] .
Зображення в сірому кольорі з фоновими пікселями, позначені як 255.
1,172,907
Зображення, текст
Розпізнавання рукописного тексту, класифікація
2009
[ 93]
CASIA
CASIA-OLHWDB
База даних рукописних китайських ієрогліфів онлайн, зібрана за допомогою ручки Anoto на папері. 3755 класів у наборі символів GB 2312 [en] .
Надає послідовності координат штрихів.
1,174,364
Зображення, текст
Розпізнавання рукописного тексту, класифікація
2009
[ 93] [ 94]
CASIA
Character Trajectories Dataset
Марковані зразки траєкторій кінчика пера для людей, які пишуть прості символи.
3-dimensional pen tip velocity trajectory matrix for each sample
2858
Текст
Розпізнавання рукописного тексту, класифікація
2008
[ 95] [ 96]
B. Williams
Chars74K Dataset
Розпізнавання символів у природних зображеннях символів, які використовуються як англійською, так і каннадською
Тривимірна матриця траєкторій швидкості кінчика пера для кожного зразка
74,107
Розпізнавання символів, розпізнавання рукописного тексту, OCR, класифікація
2009
[ 97]
T. de Campos
EMNIST dataset
Рукописні символи від 3600 авторів
Похідне від спеціальної бази даних NIST 19. Перетворено на зображення розміром 28x28 пікселів, що відповідають набору даних MNIST.[ 98]
800,000
Зображення
розпізнавання символів, класифікація, розпізнавання почерку
2016
EMNIST dataset[ 99]
Documentation[ 100]
Gregory Cohen, et al
UJI Pen Characters Dataset
Ізольовані рукописні символи
Дано координати положення пера як символи.
11,640
Текст
Розпізнавання рукописного тексту, класифікація
2009
[ 101] [ 102]
F. Prat et al.
Gisette Dataset
Зразки почерку з 4 і 9 символів, які часто плутають.
Функції, витягнуті з зображень, розділені на train/test, розмір зображень рукописного введення нормалізовано.
13,500
Зображення, текст
Розпізнавання рукописного тексту, класифікація
2003
[ 103]
Yann LeCun et al.
Omniglot dataset
1623 різних рукописних символи з 50 різних алфавітів.
Марковані вручну.
38,300
Зображення, текст
Класифікація, одноразове навчання
2015
[ 104] [ 105]
American Association for the Advancement of Science
MNIST database
База даних рукописних цифр.
Марковані вручну.
60,000
Зображення, текст
Класифікація
1998
[ 106] [ 107]
National Institute of Standards and Technology
Optical Recognition of Handwritten Digits Dataset
Нормовані растрові зображення рукописних даних.
Розмір нормалізовано та зіставлено на растрові зображення.
5620
Зображення, текст
Розпізнавання рукописного тексту, класифікація
1998
[ 108]
E. Alpaydin et al.
Pen-Based Recognition of Handwritten Digits Dataset
Рукописні цифри на електронній ручці-планшеті.
Витягуються вектори ознак для рівномірного розміщення.
10,992
Зображення, текст
Розпізнавання рукописного тексту, класифікація
1998
[ 109] [ 110]
E. Alpaydin et al.
Semeion Handwritten Digit Dataset
Рукописні цифри від 80 осіб.
Усі рукописні цифри нормалізовано за розміром і відображено в одній сітці.
1593
Зображення, текст
Розпізнавання рукописного тексту, класифікація
2008
[ 111]
T. Srl
HASYv2
Рукописні математичні символи
Усі символи відцентровані та мають розмір 32px x 32px.
168233
Зображення, текст
Класифікація
2017
[ 112]
Martin Thoma
Noisy Handwritten Bangla Dataset
Включає набір даних рукописних цифр (10 класів) і базовий набір даних символів (50 класів), кожен набір даних має три типи шуму: білий гаусів, розмиття в русі та знижену контрастність.
Усі зображення відцентровані та мають розмір 32x32.
Numeral Dataset:
23330,
Character Dataset:
76000
Зображення, текст
Розпізнавання рукописного тексту, класифікація
2017
[ 113] [ 114]
M. Karki et al.
Аерофотознімки
Назва
Опис
Обробка
Розмір
Формат
Задачі
Створення
Посилання
Джерело
iSAID: Instance Segmentation in Aerial Images Dataset
Точна анотація на рівні екземпляра, виконана професійними анотаторами, перевірена та підтверджена експертними анотаторами, які відповідають чітко визначеним інструкціям.
655,451 (15 classes)
Зображення, jpg, json
Повітряна класифікація, виявлення об'єктів, сегментація екземплярів
2019
[ 115] [ 115]
Syed Waqas Zamir, Aditya Arora, Akshita Gupta, Salman Khan, Guolei Sun, Fahad Shahbaz Khan, Fan Zhu, Ling Shao, Gui-Song Xia, Xiang Bai
Aerial Image Segmentation Dataset
80 аерофотознімків високої роздільної здатності з просторовою роздільною здатністю від 0,3 до 1,0.
Зображення сегментовані вручну.
80
Зображення
Повітряна класифікація, виявлення об'єктів
2013
[ 116] [ 117]
J. Yuan et al.
KIT AIS Data Set
Кілька позначених наборів навчальних та оцінювальних даних аерофотознімків натовпу.
Зображення, позначені вручну, щоб показувати шляхи людей через натовп
~ 150
Зображення з доріжками
Відстеження людей, повітряне спостереження
2012
[ 116] [ 118]
M. Butenuth et al.
Wilt Dataset
Дані дистанційного зондування хворих дерев та іншого ґрунтового покриву.
Вилучено різні функції.
4899
Зображення
Класифікація, виявлення повітряних об'єктів
2014
[ 119] [ 120]
B. Johnson
MASATI dataset
Морські сцени оптичних аерофотознімків із видимого спектру. Він містить кольорові зображення в динамічних морських середовищах, кожне зображення може містити одну або кілька цілей за різних погодних умов і умов освітлення.
Обмежувальні рамки та маркування об'єктів.
7389
Зображення
Класифікація, виявлення повітряних об'єктів
2018
[ 121] [ 122]
A.-J. Gallego et al.
Forest Type Mapping Dataset
Супутникові зображення лісів Японії.
Вилучено діапазони довжин хвилі зображення.
326
Текст
Класифікація
2015
[ 123] [ 124]
B. Johnson
Overhead Imagery Research Data Set [en]
Коментовані зображення накладних. Зображення з кількома об'єктами.
Понад 30 анотацій і понад 60 статистичних даних, які описують ціль у контексті зображення.
1000
Зображення, текст
Класифікація
2009
[ 125] [ 126]
F. Tanner et al.
SpaceNet
SpaceNet — це сукупність комерційних супутникових зображень і позначених навчальних даних.
Файли GeoTiff і GeoJSON, що містять сліди будівлі.
>17533
Зображення
Класифікація, ідентифікація об'єкта
2017
[ 127] [ 128] [ 129]
DigitalGlobe, Inc. [en]
UC Merced Land Use Dataset
Ці зображення були вручну витягнуті з великих зображень із колекції зображень міських районів Національної карти USGS для різних міських районів США.
Це 21-класний набір зображень землекористування, призначений для дослідницьких цілей. Для кожного класу є 100 зображень.
2,100
Зображення фішки розміром 256x256, 30 см (1 фут) GSD
Класифікація земельного покриву
2010
[ 130]
Yi Yang and Shawn Newsam
SAT-4 Airborne Dataset
Зображення було витягнуто з набору даних Національної програми зображення сільського господарства (NAIP).
SAT-4 має чотири широкі класи ґрунтового покриву, включає безплідні землі, дерева, пасовища та клас, який складається з усіх класів ґрунтового покриву, крім трьох вищезазначених.
500,000
Зображення
Класифікація
2015
[ 131] [ 132]
S. Basu et al.
SAT-6 Airborne Dataset
Зображення було витягнуто з набору даних Національної програми зображення сільського господарства (NAIP).
SAT-6 має шість широких класів ґрунтового покриву, включає безплідні землі, дерева, пасовища, дороги, будівлі та водойми.
405,000
Зображення
Класифікація
2015
[ 131] [ 133]
S. Basu et al.
Інші зображення
Назва
Опис
Обробка
Розмір
Формат
Задачі
Створення
Посилання
Джерело
NRC-GAMMA
Новий еталонний набір зображень газового лічильника
Жодного
28,883
Зображення, етикетка
Класифікація
2021
[ 134] [ 135]
A. Ebadi, P. Paul, S. Auer, & S. Tremblay
The SUPATLANTIQUE dataset
Зображення відсканованих офіційних документів та документів Вікіпедії
Жодного
4908
TIFF/pdf
Ідентифікація вихідного пристрою, виявлення підробок, класифікація,…
2020
[ 136]
C. Ben Rabah et al.
Density functional theory quantum simulations of graphene
Позначені зображення вихідних даних для моделювання графену
Необроблені дані (у форматі HDF5) і вихідні мітки з квантового моделювання теорії функціональної щільності
60744 тестових і 501473 навчальних файлів
Марковані зображення
Регресія
2019
[ 137]
K. Mills & I. Tamblyn
Quantum simulations of an electron in a two dimensional potential well
Позначені зображення вихідних даних для моделювання 2d квантової механіки
Необроблені дані (у форматі HDF5) та вихідні мітки з квантового моделювання
1,3 мільйона зображень
Марковані зображення
Регресія
2017
[ 138]
K. Mills, M.A. Spanner, & I. Tamblyn
MPII Cooking Activities Dataset
Відео та зображення різних кулінарних заходів.
Шляхи та напрямки діяльності, мітки, дрібнозернисте позначення руху, клас активності, вилучення та маркування нерухомих зображень.
881,755 frames
Марковані відео, зображення, текст
Класифікація
2012
[ 139] [ 140]
M. Rohrbach et al.
FAMOS Dataset
5000 унікальних мікроструктур, всі зразки були отримані 3 рази за допомогою двох різних камер.
Оригінальні файли PNG, відсортовані за камерою, а потім за придбанням. Файли даних MATLAB з однією матрицею 16384 разів 5000 на камеру на одержання.
30,000
Файли зображень і .mat
Аутентифікація
2012
[ 141]
S. Voloshynovskiy, et al.
PharmaPack Dataset
1000 унікальних класів з 54 зображеннями в класі.
Маркування класів, багато локальних дескрипторів, таких як SIFT і aKaZE, і локальні агреатори функцій, як-от Fisher Vector (FV).
54,000
Файли зображень і .mat
Дрібнозерниста класифікація
2017
[ 142]
O. Taran and S. Rezaeifar, et al.
Stanford Dogs Dataset
Зображення 120 порід собак з усього світу.
Надаються розділи для навчання/тесту та анотації ImageNet.
20,580
Зображення, текст
Дрібнозерниста класифікація
2011
[ 143] [ 144]
A. Khosla et al.
StanfordExtra Dataset
2D ключові точки та сегментації для набору даних Stanford Dogs.
Надано 2D ключові точки та сегментації.
12,035
Марковані зображення
3D реконструкція/оцінка пози
2020
[ 145]
B. Biggs et al.
The Oxford-IIIT Pet Dataset
37 категорій домашніх тварин із приблизно 200 зображеннями кожної.
Мітка породи, щільна рамка, сегментація переднього плану та фону.
~ 7,400
Зображення, текст
Класифікація, виявлення об'єктів
2012
[ 144] [ 146]
O. Parkhi et al.
Corel Image Features Data Set
База даних зображень з витягнутими функціями.
Багато функцій, включаючи гістограму кольорів, текстуру спільного появи та колірні моменти,
68,040
Текст
Класифікація, виявлення об'єктів
1999
[ 147] [ 148]
M. Ortega-Bindenberger et al.
Online Video Characteristics and Transcoding Time Dataset.
Час перекодування для різних відео та властивостей відео.
Надано функції відео.
168,286
Текст
Регресія
2015
[ 149]
T. Deneke et al.
Microsoft Sequential Image Narrative Dataset (SIND)
Набір даних для послідовного перегляду мови
Описові підписи та розповідь наведено для кожної фотографії, а фотографії розташовані в послідовності
81,743
Зображення, текст
Візуальне оповідання
2016
[ 150]
Microsoft Research
Caltech-UCSD Birds-200-2011 Dataset
Великий набір зображень птахів.
Розташування частин для птахів, рамки, 312 бінарних атрибутів
11,788
Зображення, текст
Класифікація
2011
[ 151] [ 152]
C. Wah et al.
YouTube-8M
Великий і різноманітний набір відеоданих із мітками
Ідентифікатори відео YouTube і пов'язані мітки з різноманітного словника з 4800 візуальних об'єктів
8 million
Відео, текст
Класифікація відео
2016
[ 153] [ 154]
S. Abu-El-Haija et al.
YFCC100M
Великий і різноманітний набір даних зображень і відео з мітками
Розташування частин для птахів, обмежувальні рамки, 312 бінарних атрибутів, надані Flickr Videos and Images та пов'язані описи, назви, теги та інші метадані (наприклад, EXIF та геотеги)
100 million
Відео, зображення, текст
Класифікація відео та зображень
2016
[ 155] [ 156]
B. Thomee et al.
Discrete LIRIS-ACCEDE
Короткі відео з анотаціями для валентності та збудження.
Етикетки валентності та збудження.
9800
Відео
Відео виявлення емоцій
2015
[ 157]
Y. Baveye et al.
Continuous LIRIS-ACCEDE
Довгі відео з анотаціями для валентності та збудження, а також зібрані гальванічні реакції шкіри.
Етикетки валентності та збудження.
30
Відео
Відео виявлення емоцій
2015
[ 158]
Y. Baveye et al.
MediaEval LIRIS-ACCEDE
Розширення Discrete LIRIS-ACCEDE, включаючи анотації для рівнів насильства у фільмах.
Мітки насильства, валентності та збудження.
10900
Відео
Відео виявлення емоцій
2015
[ 159]
Y. Baveye et al.
Leeds Sports Pose
Артикуловані анотації людської пози на 2000 природних спортивних зображеннях із Flickr.
Грубий урожай навколо однієї особи, яка цікавить, з 14 спільними етикетками
2000
Зображення плюс мітки файлів .mat
Оцінка пози людини
2010
[ 160]
S. Johnson and M. Everingham
Leeds Sports Pose Extended Training
Чітко сформульовані анотації людської пози на 10 000 природних спортивних зображень із Flickr.
14 спільних етикеток через краудсорсинг
10000
Зображення плюс мітки файлів .mat
Оцінка пози людини
2011
[ 161]
S. Johnson and M. Everingham
MCQ Dataset
6 різних реальних іспитів із множинним вибором (735 бланків відповідей і 33 540 блоків відповідей) для оцінки методів і систем комп'ютерного зору, розроблених для систем оцінювання тестів із множинним вибором.
Жодного
735 бланків відповідей та 33 540 скриньок для відповідей
Мітки файлів зображень і .mat
Розробка систем оцінювання тестів із множинним вибором
2017
[ 162] [ 163]
Afifi, M. et al.
Surveillance Videos
Справжні відеоспостереження охоплюють великий час спостереження (7 днів по 24 години кожне).
Жодного
19 surveillance videos (7 days with 24 hours each).
Відео
Стиснення даних
2016
[ 164]
Taj-Eddin, I. A. T. F. et al.
LILA BC
Маркована інформаційна бібліотека Олександрії: біологія та охорона. Позначені зображення, які підтримують дослідження машинного навчання в галузі екології та екології.
Жодного
~10M images
Зображення
Класифікація
2019
[ 165]
LILA working group
Can We See Photosynthesis?
32 відео для восьми живих і восьми мертвих листків, записаних в умовах освітлення постійного та змінного струму.
Жодного
32 відео
Відео
Виявлення живості рослин
2017
[ 166]
Taj-Eddin, I. A. T. F. et al.
Mathematical Mathematics Memes
Колекція з 10 000 мемів з математики.
Жодного
~10,000
Зображення
Візуальне оповідання, виявлення об'єктів.
2021
[ 167]
Mathematical Mathematics Memes
Текстові дані
Ці набори даних складаються переважно з тексту для таких завдань, як обробка мови , аналіз настроїв , переклад і кластерний аналіз .
Відгуки
Назва
Опис
Оброботка
Розмір
Формат
Задачі
Створення
Посилання
Джерело
Amazon reviews
Огляди американських продуктів від Amazon.com.
Жодного
233.1 million
Текст
Класифікація, аналіз настроїв
2015 (2018)
[ 168] [ 169]
McAuley et al.
OpinRank Review Dataset
Огляди автомобілів і готелів від Edmunds.com і TripAdvisor відповідно.
Жодного
42,230 / ~259,000 respectively
Текст
Аналіз настроїв, кластеризація
2011
[ 170] [ 171]
K. Ganesan et al.
MovieLens
22 000 000 оцінок і 580 000 тегів застосовано до 33 000 фільмів 240 000 користувачів.
Жодного
~ 22M
Текст
Регресія, кластеризація, класифікація
2016
[ 172] [ 173]
GroupLens Research [en]
Yahoo! Music User Ratings of Musical Artists
Понад 10 мільйонів рейтингів виконавців від користувачів Yahoo.
Жодного не описано.
~ 10M
Текст
Класифікація, регресія
2004
[ 174] [ 175]
Yahoo!
Car Evaluation Data Set
Властивості автомобіля та їх загальна прийнятність.
Наведено шість категоріальних ознак.
1728
Текст
Класифікація
1997
[ 176]
M. Bohanec
YouTube Comedy Slam Preference Dataset
Дані про голосування користувачів для пар відео, які відображаються на YouTube. Користувачі голосували за смішніші відео.
Надано метадані відео.
1,138,562
Текст
Класифікація
2012
[ 177] [ 178]
Google
Skytrax User Reviews Dataset
Відгуки користувачів про авіакомпанії, аеропорти, місця та салони від Skytrax.
Оцінки є дрібними і включають багато аспектів досвіду в аеропорту.
41396
Текст
Класифікація, регресія
2015
[ 179]
Q. Nguyen
Teaching Assistant Evaluation Dataset
Огляди помічника вчителя.
Наведено особливості кожного екземпляра, такі як клас, розмір класу та викладач.
151
Текст
Класифікація
1997
[ 180]
W. Loh et al.
Vietnamese Students’ Feedback Corpus (UIT-VSFC)
Відгуки студентів.
Коментарі
16,000
Текст
Класифікація
1997
[ 181] [ 182]
Nguyen et al.
Vietnamese Social Media Emotion Corpus (UIT-VSMEC)
Коментарі користувачів у Facebook.
Коментарі
6,927
Текст
Класифікація
1997
[ 183]
Nguyen et al.
Vietnamese Open-domain Complaint Detection dataset (ViOCD)
Коментарі користувачів у Facebook.
Коментарі
5,485
Текст
Класифікація
2021
[ 184]
Nguyen et al.
Новини
Назва
Опис
Обробка
Розмір
Формат
Задачі
Створення
Посилання
Джерело
NYSK Dataset
Англійські новини про справу щодо звинувачень у сексуальному насильстві проти колишнього директора МВФ Домініка Стросс-Кана.
Відфільтровано та представлено у форматі XML.
10,421
XML, текст
Аналіз настроїв, виділення теми
2013
[ 185]
Dermouche, M. et al.
The Reuters Corpus Volume 1
Великий корпус новин Reuters англійською мовою.
Дрібнозерниста категоризація та коди тем.
810,000
Текст
Класифікація, кластеризація, узагальнення
2002
[ 186]
Reuters
The Reuters Corpus Volume 2
Великий корпус новин Reuters кількома мовами.
Дрібнозерниста категоризація та коди тем.
487,000
Текст
Класифікація, кластеризація, узагальнення
2005
[ 187]
Reuters
Thomson Reuters Text Research Collection
Великий корпус новин.
Деталі не описані.
1,800,370
Текст
Класифікація, кластеризація, узагальнення
2009
[ 188]
T. Rose et al.
Saudi Newspapers Corpus
31 030 арабських газетних статей.
Вилучено метадані.
31,030
JSON
Підведення підсумків, кластеризація
2015
[ 189]
M. Alhagri
RE3D (Relationship and Entity Extraction Evaluation Dataset)
Entity and Relation позначені дані з різних новин та державних джерел. За підтримки Dstl
Відфільтровано, категоризація за допомогою типів Baleen
невідомо
JSON
Класифікація, сутність і розпізнавання відносин
2017
[ 189]
Dstl
Examiner [en] Spam Clickbait Catalogue
Приманки кліків, спам, заголовки з краудсорсингу з 2010 по 2015 рік
Опублікувати дату та заголовки
3,089,781
CSV
Кластеризація, події, настрої
2016
[ 190]
R. Kulkarni
ABC Australia News Corpus
Весь корпус новин ABC Australia з 2003 по 2019 рік
Опублікувати дату та заголовки
1,186,018
CSV
Кластеризація, події, настрої
2020
[ 191]
R. Kulkarni
Worldwide News – Aggregate of 20K Feeds [en]
Тижневий знімок усіх онлайн-заголовків понад 20 мовами
Час публікації, URL-адреса та заголовки
1,398,431
CSV
Кластеризація, події, визначення мови
2018
[ 192]
R. Kulkarni
Reuters News Wire Headline
11 років подій із мітками часу, опублікованих у новинах
Час публікації, текст заголовка
16,121,310
CSV
НЛП, Комп'ютерна лінгвістика, Події
2018
[ 193]
R. Kulkarni
Ireland News Corpus
Новини 24 років Ірландії з 1996 по 2019 рік
Час публікації, категорія заголовка та текст
1,484,340
CSV
НЛП, Комп'ютерна лінгвістика, Події
2020
[ 194]
R. Kulkarni
News Headlines Dataset for Sarcasm Detection
Високоякісний набір даних із саркастичними та несаркастичними заголовками новин.
Чистий, нормований текст
26,709
JSON
НЛП, Комп'ютерна лінгвістика
2018
[ 195]
Rishabh Misra
Повідомлення
Назва
Опис
Обробка
Розмір
Формат
Задачі
Створення
Посилання
Джерело
Enron Email Dataset
Електронні листи від співробітників Enron розбиті в папки.
Вкладення видалено, недійсні адреси електронної пошти перетворені на user@enron.com або no_address@enron.com
~ 500,000
Текст
Аналіз мережі, аналіз настроїв
2004 (2015)
[ 196] [ 197]
Klimt, B. and Y. Yang
Ling-Spam Dataset
Корпус, що містить як легітимні листи, так і спам.
Чотири версії корпусу щодо того, чи був увімкнений лемматизатор чи стоп-лист.
2,412 Ham 481 Spam
Текст
Класифікація
2000
[ 198] [ 199]
Androutsopoulos, J. et al.
SMS Spam Collection Dataset
Зібрані SMS-повідомлення зі спамом.
Немає
5,574
Текст
Класифікація
2011
[ 200] [ 201]
T. Almeida et al.
Messages from 20 different newsgroups.
Повідомлення з 20 різних груп новин.
Немає
20,000
Текст
Обробка природної мови
1999
[ 202]
T. Mitchell et al.
Spambase Dataset
Спам електронних листів.
Вилучено багато текстових функцій.
4,601
Текст
Виявлення спаму, класифікація
1999
[ 203]
M. Hopkins et al.
Твіттер і твіти
Назва
Опис
Обробка
Розмір
Формат
Задачі
Створення
Посилання
Джерело
MovieTweetings
Набір даних рейтингу фільмів на основі загальнодоступних і добре структурованих твітів
~710,000
Текст
Класифікація, регресія
2018
[ 204]
S. Dooms
Twitter100k
Пари зображень і твітів
100,000
Текст і зображення
Міжмедійний пошук
2017
[ 205] [ 206]
Y. Hu, et al.
Sentiment140
Дані твітів за 2009 рік, включаючи оригінальний текст, мітку часу, користувача та настрої.
Класифіковано за допомогою дистанційного спостереження від наявності смайлика в твіті.
1,578,627
Твіти, коми, розділені значення
аналіз настроїв
2009
[ 207] [ 208]
A. Go et al.
ASU Twitter Dataset
Дані мережі Twitter, а не фактичні твіти. Показує зв’язки між великою кількістю користувачів.
Немає
11 316 811 користувачів, 85 331 846 підключень
Текст
Кластеризація, аналіз графів
2009
[ 209] [ 210]
R. Zafarani et al.
SNAP Social Circles: Twitter Database
Великі дані мережі Twitter.
Характеристики вузлів, кола та мережі его.
1,768,149
Текст
Кластеризація, аналіз графів
2012
[ 211] [ 212]
J. McAuley et al.
Twitter Dataset for Arabic Sentiment Analysis
Арабські твіти.
Зразки, позначені вручну як позитивні чи негативні.
2000
Текст
Класифікація
2014
[ 213] [ 214]
N. Abdulla
Buzz in Social Media Dataset
Дані з Twitter і Tom's Hardware. Цей набір даних зосереджено на конкретних актуальних темах, які обговорюються на цих сайтах.
Дані відображаються у вікні, щоб користувач міг спробувати передбачити події, які призвели до шуму в соціальних мережах.
140,000
Текст
Регресія, класифікація
2013
[ 215] [ 216]
F. Kawala et al.
Paraphrase and Semantic Similarity in Twitter (PIT)
Цей набір даних зосереджується на тому, чи мають твіти (майже) однакове значення/інформацію чи ні. Маркування вручну.
токенізацію, тегування частин мови та іменованих об’єктів
18,762
Текст
Регресія, класифікація
2015
[ 217] [ 218]
Xu et al.
Geoparse Twitter benchmark dataset
Цей набір даних містить твіти під час різних новинних подій у різних країнах. Згадки про місцеположення, позначені вручну.
до метаданих JSON додано анотації про місцезнаходження
6,386
Tweets, JSON
Класифікація, вилучення інформації
2014
[ 219] [ 220]
S.E. Middleton et al.
Dutch Social media collection
Цей набір даних містить твіти про COVID-19, зроблені нідерландськими носіями або користувачами з Нідерландів. Дані були позначені машиною
класифіковано за настрої, текст твітів і опис користувача, перекладений англійською. Вилучаються згадки про галузь
271,342
JSONL
Настрої, класифікація з кількома мітками, машинний переклад
2020
[ 221] [ 222] [ 223]
Aaaksh Gupta, CoronaWhy
Діалоги
Назва
Опис
Обробка
Розмір
Формат
Задачі
Створення
Посилання
Джерело
NPS Chat Corpus
Публікації з вікових онлайн-чатів.
Конфіденційність рук замаскована, позначена як частина мови та діалог-акт.
~ 500,000
XML
НЛП, програмування, лінгвістика
2007
[ 224]
Forsyth, E., Lin, J., & Martell, C.
Twitter Triple Corpus
A-B-A трійки витягнуто з Twitter.
4,232
Текст
NLP
2016
[ 225]
Sordini, A. et al.
UseNet Corpus
Повідомлення на форумі UseNet.
Анонімні електронні листи та URL-адреси. Пропущені документи довжиною <500 слів або >500 000 слів, або які були <90% англійською.
7 billion
Текст
2011
[ 226]
Shaoul, C., & Westbury C.
NUS SMS Corpus
SMS-повідомлення, зібрані між двома користувачами, з аналізом часу.
~ 10,000
XML
NLP
2011
[ 227]
KAN, M
Reddit All Comments Corpus
Усі коментарі на Reddit (станом на 2015 рік).
~ 1.7 billion
JSON
НЛП, дослідження
2015
[ 228]
Stuck_In_the_Matrix
Ubuntu Dialogue Corpus
Діалоги, витягнуті з потоку чату Ubuntu на IRC.
930 thousand dialogues, 7.1 million utterances
CSV
Dialogue Systems Research
2015
[ 229]
Lowe, R. et al.
Dialog State Tracking Challenge
Проблеми відстеження стану діалогу 2 і 3 (DSTC2&3) були дослідницьким завданням, зосередженим на покращенні сучасного рівня відстеження стану мовних діалогових систем.
Транскрипція розмовних діалогів з маркуванням
DSTC2 contains ~3.2k calls – DSTC3 contains ~2.3k calls
Json
Відстеження стану діалогу
2014
[ 230]
Henderson, Matthew and Thomson, Blaise and Williams, Jason D
Інший текст
Назва
Опис
Обробка
Розмір
Формат
Формат
Створений
Посилання
Джерело
Web of Science Dataset
Ієрархічні набори даних для класифікації тексту
Немає
46,985
Текст
класифікація,
Категоризація
2017
[ 231] [ 232]
K. Kowsari et al.
Legal Case Reports
Розгляд справ Федерального суду Австралії з 2006 по 2009 роки.
Немає
4,000
Текст
Підведення підсумків,
аналіз цитування
2012
[ 233] [ 234]
F. Galgani et al.
Blogger Authorship Corpus
Записи в блозі 19 320 людей із blogger.com.
Блогер сам надає стать, вік, галузь та астрологічний знак.
681,288
Текст
Аналіз настроїв, узагальнення, класифікація
2006
[ 235] [ 236]
J. Schler et al.
Social Structure of Facebook Networks
Великий набір даних соціальної структури Facebook.
Немає
Охоплено 100 коледжів
Текст
Аналіз мережі, кластеризація
2012
[ 237] [ 238]
A. Traud et al.
Dataset for the Machine Comprehension of Text
Розповіді та відповідні запитання для перевірки розуміння тексту.
Немає
660
Текст
Обробка природної мови, машинне розуміння
2013
[ 239] [ 240]
M. Richardson et al.
The Penn Treebank Project
Природний текст, анотований для мовної структури.
Текст розбирається на семантичні дерева.
~ 1 млн слів
Текст
Обробка природної мови, узагальнення
1995
[ 241] [ 242]
M. Marcus et al.
DEXTER Dataset
Поставлене завдання – визначити за наведеними ознаками, які статті стосуються корпоративних придбань.
Вилучені ознаки включають основи слів. Включені функції відволікача.
2600
Текст
Класифікація
2008
[ 243]
Reuters
Google Books N-grams
N-грами з дуже великого корпусу книг
Немає
2,2 ТБ тексту
Текст
Класифікація, кластеризація, регресія
2011
[ 244] [ 245]
Google
Personae Corpus
Зібрано для експериментів із визначення авторства та передбачення особистості. Складається з 145 есе голландською мовою.
Крім звичайних текстів наводяться синтаксично анотовані тексти.
145
Текст
Класифікація, регресія
2008
[ 246] [ 247]
K. Luyckx et al.
CNAE-9 Dataset
Завдання на категоризацію для вільних текстових описів бразильських компаній.
Вилучено частоту слів.
1080
Текст
Класифікація
2012
[ 248] [ 249]
P. Ciarelli et al.
Sentiment Labeled Sentences Dataset
3000 речень, позначених настроєм
Настрої кожного речення вручну позначені як позитивні чи негативні.
3000
Текст
Класифікація, аналіз настроїв
2015
[ 250] [ 251]
D. Kotzias
BlogFeedback Dataset
Набір даних для прогнозування кількості коментарів, які отримає публікація на основі функцій цієї публікації.
Вилучено багато функцій кожного повідомлення.
60,021
Текст
Регресія
2014
[ 252] [ 253]
K. Buza
Stanford Natural Language Inference (SNLI) Corpus
Підписи до зображень поєднуються з нещодавно створеними реченнями, щоб утворити суть, протиріччя або нейтральні пари.
Мітки класів Entailment, синтаксичний аналіз за допомогою аналізатора Stanford PCFG
570,000
Текст
Висновок природної мови/розпізнавання тексту
2015
[ 254]
S. Bowman et al.
DSL Corpus Collection (DSLCC)
Багатомовна збірка коротких уривків публіцистичних текстів схожими мовами та діалектами.
Немає
294,000 фраз
Текст
Розрізнення схожих мов
2017
[ 255]
Tan, Liling et al.
Urban Dictionary Dataset
Корпус слів, голосів і визначень
Імена користувачів анонімні
2,580,925
CSV
НЛП, машинне розуміння
2016 May
[ 256]
Anonymous
T-REx
Реферати Вікіпедії узгоджені з сутностями Вікіданих
Вирівнювання трійок Вікіданих з тезами Вікіпедії
11M вирівняні трійки
JSON and NIF [3]
НЛП, вилучення відносин
2018
[ 257]
H. Elsahar et al.
General Language Understanding Evaluation (GLUE)
Тест із дев’яти завдань
Різні
~1М речень і пар речень
NLU
2018
[ 258] [ 259] [ 260]
Wang et al.
Contract Understanding Atticus Dataset (CUAD) (formerly known as Atticus Open Contract Dataset (AOK))
Набір даних юридичних договорів з багатими експертними анотаціями
~13 000 етикеток
CSV and PDF
Обробка природної мови, QnA
2021
The Atticus Project
Vietnamese Image Captioning Dataset (UIT-ViIC)
В'єтнамський набір даних підписів зображень
19 250 підписів для 3 850 зображень
CSV and PDF
Обробка природної мови, комп’ютерний зір
2020
[ 261]
Lam et al.
Vietnamese Names annotated with Genders (UIT-ViNames)
В’єтнамські назви з анотаціями статей
26 850 в’єтнамських повних імен із анотацією статі
CSV
Обробка природної мови
2020
[ 262]
To et al.
Vietnamese Constructive and Toxic Speech Detection Dataset (UIT-ViCTSD)
В'єтнамський набір даних для виявлення конструктивної та токсичної мови
10 000 в'єтнамських користувачів прокоментували інтернет-газети в 10 доменах
CSV
Обробка природної мовиОбробка природної мови
2021
[ 263]
Nguyen et al.
The Pile
Збірка кількох великих наборів даних із різноманітних і неструктурованих текстів
Різні (видалення HTML і Javascript з веб-сайтів, видалення повторюваних речень)
825 ГіБ англійським текстом
JSON[ 264] [ 265] Lines
Обробка природної мови, передбачення тексту
2021
[ 266] [ 267]
Gao et
Звукові дані
Ці набори даних складаються зі звуків і звукових функцій, які використовуються для таких завдань, як розпізнавання мовлення та синтез мовлення.
Мовлення
Назва
Опис
Обробка
Розмір
Формат
Задачі
Створення
Посилання
Джерело
Zero Resource Speech Challenge 2015
Спонтанне мовлення (англійська мова), Читана мова (Xitsonga).
Немає, необроблені файли WAV.
англійська: 5 год, 12 динаміків; Xitsonga: 2:30, 24 динаміки
WAV (audio only)
Неконтрольоване виявлення мовних властивостей/підрядних одиниць/одиниць слів
2015
[ 268] [ 269]
Versteegh et al.
Parkinson Speech Dataset
Багато записів людей із хворобою Паркінсона та без неї.
Вилучено голосові характеристики, оцінка захворювання лікарем за уніфікованою шкалою оцінки хвороби Паркінсона [en] .
1,040
Текст
Класифікація, регресія
2013
[ 270] [ 271]
B. E. Sakar et al.
Spoken Arabic Digits
Розмовні арабські цифри з 44 чоловіків і 44 жінок.
Часові ряди коефіцієнтів мел-частотного кепстру .
8,800
Текст
Класифікація
2010
[ 272] [ 273]
M. Bedda et al.
ISOLET Dataset
Назви розмовних букв.
Особливості, витягнуті зі звуків.
7797
Текст
Класифікація
1994
[ 274] [ 275]
R. Cole et al.
Japanese Vowels Dataset
Дев'ять чоловіків, які говорять, вимовляли дві японські голосні підряд.
Застосував до нього 12-градусний аналіз лінійного прогнозування, щоб отримати дискретно-часовий ряд з 12 коефіцієнтами кепстру.
640
Текст
Класифікація
1999
[ 276] [ 277]
M. Kudo et al.
Parkinson's Telemonitoring Dataset
Багато записів людей із хворобою Паркінсона та без неї.
Вилучено звукові характеристики.
5875
Текст
Класифікація
2009
[ 278] [ 279]
A. Tsanas et al.
TIMIT [en]
Записи 630 носіїв восьми основних діалектів американської англійської, кожен з яких читає десять фонетично насичених речень.
Мовлення лексично і фонематично транскрибується.
6300
Текст
Розпізнавання мовлення, класифікація.
1986
[ 280] [ 281]
J. Garofolo et al.
Arabic Speech Corpus [en]
Корпус мовлення сучасної стандартної арабської мови (MSA) для одного мовця з фонетичними та орфографічними транскриптами, вирівняними на рівні фонем.
Мовлення орфографічно і фонетично транскрибується з наголосами.
~1900
Текст, WAV
Синтез мовлення, розпізнавання мовлення, вирівнювання корпусу, логопедія, освіта.
2016
[ 282]
N. Halabi
Common Voice [en]
Загальнодоступна база даних краудсорсингу в широкому діапазоні діалектів.
Перевірка іншими користувачами.
English: 1,118 hours
MP3 з відповідними текстовими файлами
Розпізнавання мови
June 2017 (December 2019)
[ 283]
Mozilla
LJSpeech
Корпус англійських записів аудіокниг, які є загальнодоступними, розбитими на короткі кліпи за розділовими знаками.
Перевірка якості, нормалізована транскрипція поряд з оригіналом.
13,100
CSV, WAV
Синтез мовлення
2017
[ 284]
Keith Ito, Linda Johnson
Музика
Назва
Опис
Обробка
Розмір
Формат
Задачі
Створення
Посилання
Джерело
Geographic Origin of Music Data Set
Звукові особливості музичних зразків з різних місць.
Функції аудіо, отримані за допомогою програмного забезпечення MARSYAS.
1,059
Текст
Географічна класифікація, кластеризація
2014
[ 285] [ 286]
F. Zhou et al.
Million Song Dataset
Звукові функції з мільйона різних пісень.
Функції аудіо вилучено.
1M
Текст
Класифікація, кластеризація
2011
[ 287] [ 288]
T. Bertin-Mahieux et al.
MUSDB18
Багатодоріжкові записи популярної музики
Сирий звук
150
MP4, WAV
Поділ джерел
2017
[ 289]
Z. Rafii et al.
Free Music Archive [en]
Аудіо під Creative Commons із 100 тисяч пісень (343 дні, 1TiB) з ієрархією із 161 жанру, метаданими, даними користувача, текстом у довільній формі.
Функції необробленого звуку та аудіо.
106,574
Текст , MP3
Класифікація, рекомендація
2017
[ 290]
M. Defferrard et al.
Bach Choral Harmony Dataset
Хоральні акорди Баха.
Функції аудіо вилучено.
5665
Текст
Класифікація
2014
[ 291] [ 292]
D. Radicioni et al.
Інші звуки. Класифікація
Назва
Опис
Обробка
Розмір
Формат
Задачі
Створення
Посилання
Джерело
UrbanSound
Марковані звукозаписи звуків, таких як кондиціонери, автомобільні гудки та діти, які грають.
Відсортовано по папках за класом подій, а також метаданими у файлі JSON та анотаціями у файлі CSV.
1,059
Звук
(WAV)
Класифікація
2014
[ 293] [ 294]
J. Salamon et al.
AudioSet
10-секундні звукові фрагменти з відео YouTube та онтологія з понад 500 міток.
128-d PCA'd VGG-ish показує кожні 1 секунду.
2,084,320
Текстові (CSV) і файли TensorFlow Record
Класифікація
2017
[ 295]
J. Gemmeke et al., Google
Bird Audio Detection challenge
Аудіо зі станцій моніторингу навколишнього середовища, а також записи з краудсорсингу
17,000+
Класифікація
2016 (2018)
[ 296] [ 297]
Queen Mary University and IEEE Signal Processing Society [en]
WSJ0 Hipster Ambient Mixtures
Аудіо з WSJ0 змішано з шумом, записаним у районі затоки Сан-Франциско
Кліпи з шумом, відповідні кліпам WSJ0
28,000
Звук(WAV)
Розділення джерел звуку
2019
[ 298]
Wichern, G., et al., Whisper and MERL
Clotho
4981 звуковий зразок тривалістю від 15 до 30 секунд, кожен з яких має п’ять різних підписів довжиною від 8 до 20 слів.
24,905
Звук (WAV) та текст(CSV)
Автоматичні субтитри
2020
[ 295] [ 299]
K. Drossos, S. Lipping, and T. Virtanen
Дані сигналу
Набори даних, що містять інформацію про електричний сигнал, що вимагає певної обробки сигналу для подальшого аналізу.
Електричні
Назва
Опис
Обробка
Розмір
Формат
Задачі
Створений
Посилання
Джерело
Witty Worm Dataset
Набір даних із детальною інформацією про поширення хробака Witty та заражених комп’ютерів.
Розділіть на загальнодоступний набір і обмежений набір, що містить більш конфіденційну інформацію, як-от заголовки IP і UDP.
55,909 IP addresses
Текст
Класифікація
2004
[ 300] [ 301]
Center for Applied Internet Data Analysis
Cuff-Less Blood Pressure Estimation Dataset
Очищені життєво важливі сигнали від пацієнтів, які можна використовувати для оцінки артеріального тиску.
Життєві показники 125 Гц очищено.
12,000
Текст
Класифікація, регресія
2015
[ 302] [ 302]
M. Kachuee et al.
Gas Sensor Array Drift Dataset
Вимірювання з 16 хімічних датчиків, використаних у моделюванні для компенсації дрейфу.
Велика кількість наданих функцій.
13,910
Текст
Класифікація
2012
[ 303] [ 304]
A. Vergara
Servo Dataset
Дані, що охоплюють нелінійні співвідношення, що спостерігаються в схемі сервопідсилювача.
Наведено рівні різних компонентів як функції інших компонентів.
167
Текст
Регресія
1993
[ 305] [ 306]
K. Ullrich
UJIIndoorLoc-Mag Dataset
База даних локалізації всередині приміщень для тестування внутрішніх систем позиціонування. Дані базуються на магнітному полі.
Дано розділи на тренування та тести.
40,000
Текст
Класифікація, регресія, кластеризація
2015
[ 307] [ 308]
D. Rambla et al.
Sensorless Drive Diagnosis Dataset
Електричні сигнали від двигунів з несправними компонентами.
Вилучено статистичні ознаки.
58,508
Текст
Класифікація
2015
[ 309] [ 310]
M. Bator
Відстеження рух
Назва
Опис
Обробка
Розмір
Формат
Задачі
Створенний
Посилання
Джерело
Wearable Computing: Classification of Body Postures and Movements (PUC-Rio)
Люди, які виконують п’ять стандартних дій під час носіння трекерів руху.
Немає
165,632
Текст
Класифікація
2013
[ 311] [ 312]
Pontifical Catholic University of Rio de Janeiro [en]
Gesture Phase Segmentation Dataset
Функції, отримані з відео людей, які роблять різні жести.
Вилучені функції спрямовані на вивчення фазової сегментації жестів.
9900
Текст
Класифікація, кластеризація
2014
[ 313] [ 314]
R. Madeo et a
Vicon Physical Action Data Set Dataset
10 звичайних і 10 агресивних фізичних дій, які вимірюють активність людини, яку відстежує 3D-трекер.
Багато параметрів записує 3D трекер.
3000
Текст
Класифікація
2011
[ 315] [ 316]
T. Theodoridis
Daily and Sports Activities Dataset
Дані датчиків двигуна для 19 щоденних і спортивних занять.
Надано багато датчиків, без попередньої обробки сигналів.
9120
Текст
Класифікація
2013
[ 317] [ 318]
B. Barshan et al.
Human Activity Recognition Using Smartphones Dataset
Дані гіроскопа та акселерометра від людей, які носять смартфони та виконують звичайні дії.
Виконані дії позначаються, всі сигнали попередньо обробляються на наявність шуму.
10,299
Текст
Класифікація
2012
[ 319] [ 320]
J. Reyes-Ortiz et al.
Australian Sign Language Signs
Австралійські знаки жестовою мовою, зняті рукавичками для відстеження руху.
Немає
2565
Текст
Класифікація
2002
[ 321] [ 322]
M. Kadous
Weight Lifting Exercises monitored with Inertial Measurement Units
П’ять варіантів вправи на скручування біцепса, що контролюються за допомогою IMU.
Деякі статистичні дані, розраховані на основі необроблених даних.
39,242
Текст
Класифікація
2013
[ 323] [ 324]
W. Ugulino et al.
sEMG for Basic Hand movements Dataset
Дві бази даних поверхневих електроміографічних сигналів 6 рухів рук.
Немає
3000
Текст
Класифікація
2014
[ 325] [ 326]
C. Sapsanis et al.
REALDISP Activity Recognition Dataset
Оцініть методи, що стосуються впливу зміщення датчика при розпізнаванні активності, що можна носити.
Немає
1419
Текст
Класифікація
2014
[ 326] [ 327]
O. Banos et al.
Heterogeneity Activity Recognition Dataset
Дані з кількох різних розумних пристроїв для людей, які виконують різні види діяльності.
Немає
43,930,257
Текст
Класифікація, кластеризація
2015
[ 328] [ 329]
A. Stisen et al.
Indoor User Movement Prediction from RSS Data
Тимчасові дані бездротової мережі, які можна використовувати для відстеження переміщення людей в офісі.
Немає
13,197
Текст
Класифікація
2016
[ 330] [ 331]
D. Bacciu
PAMAP2 Physical Activity Monitoring Dataset
18 різних видів фізичних навантажень, які виконували 9 випробовуваних у 3 ІДУ.
Немає
3,850,505
Текст
Класифікація
2012
[ 332]
A. Reiss
OPPORTUNITY Activity Recognition Dataset
Розпізнавання людської активності від датчиків, які можна носити, об’єкта та навколишнього середовища – це набір даних, розроблений для порівняння алгоритмів розпізнавання людської діяльності.
Немає
2551
Текст
Класифікація
2012
[ 333] [ 334]
D. Roggen et al.
Real World Activity Recognition Dataset
Розпізнавання людської діяльності за допомогою носових пристроїв. Розрізняє сім положень на корпусі пристрою та містить шість різних типів датчиків.
Немає
3 150 000 (за датчик)
Текст
Класифікація
2016
[ 335]
T. Sztyler et al.
Toronto Rehab Stroke Pose Dataset
Тривимірні оцінки пози людини (Kinect) пацієнтів із інсультом та здорових учасників, які виконують набір завдань за допомогою робота для реабілітації після інсульту.
Немає
10 здорових людей і 9 людей, які пережили інсульт (3500–6000 кадрів на людину)
CSV
Класифікація
2017
[ 336] [ 337] [ 338]
E. Dolatabadi et al.
Corpus of Social Touch (CoST)
7805 жестів фіксують 14 різних жестів соціального дотику, виконаних 31 досліджуваним. Жести виконувались у трьох варіантах: ніжні, нормальні та грубі, на сітці датчика тиску, обмотаної навколо руки манекена.
Здійснювані сенсорні жести сегментовані та позначені.
7805 зйомок жестів
CSV
Класифікація
2016
[ 339] [ 340]
M. Jung et al.
Інші сигнали
Назва
Опис
Обробка
Розмір
Формат
Задачі
Створення
Посилання
Джерело
Wine Dataset
Хімічний аналіз вин, вирощених в одному регіоні Італії, але отриманих з трьох різних сортів.
Наведено 13 властивостей кожного вина
178
Текст
Класифікація, регресія
1991
[ 341] [ 342]
M. Forina et al.
Combined Cycle Power Plant Data Set
Дані від різних датчиків на електростанції, яка працює протягом 6 років.
Жодного
9568
Текст
Регресія
2014
[ 343] [ 344]
P. Tufekci et al.
Фізичні дані
Набори даних з фізичних систем.
Фізика високих енергій
Назва
Опис
Обробка
Розмір
Формат
Задачі
Створення
Посилання
Джерело
HIGGS Dataset
Моделювання Монте-Карло зіткнень прискорювачів частинок.
Наведено 28 ознак кожного зіткнення.
11M
Текст
Класифікація
2014
[ 345] [ 346] [ 347]
D. Whiteson
HEPMASS Dataset
Моделювання Монте-Карло зіткнень прискорювачів частинок. Мета – відокремити сигнал від шуму.
Наведено 28 ознак кожного зіткнення.
10,500,000
Текст
Класифікація
2016
[ 346] [ 347] [ 348]
D. Whiteson
Системи
Назва
Опис
Обробка
Розмір
Формат
Задачі
Створення
Посилання
Джерело
Yacht Hydrodynamics Dataset
Продуктивність яхти на основі розмірів.
Для кожної яхти надано шість функцій.
308
Текст
Регресія
2013
[ 349] [ 350]
R. Lopez
Robot Execution Failures Dataset
5 наборів даних, які зосереджені на збій роботи роботів у виконанні звичайних завдань.
Цілочисельні функції, такі як крутний момент та інші вимірювання датчиків.
463
Текст
Класифікація
1999
[ 351]
L. Seabra et al.
Pittsburgh Bridges Dataset
Опис конструкції дається з точки зору кількох властивостей різних мостів.
Наведено різні особливості мосту.
108
Текст
Класифікація
1990
[ 352] [ 353]
Y. Reich et al.
Automobile Dataset
Дані про автомобілі, їх страховий ризик та нормовані збитки.
Характеристики автомобіля вилучені.
205
Текст
Регресія
1987
[ 354] [ 355]
J. Schimmer et al.
Auto MPG Dataset
Дані MPG для автомобілів.
Наведено вісім особливостей кожного автомобіля.
398
Текст
Регресія
1993
[ 356]
Carnegie Mellon University
Energy Efficiency Dataset
Вимоги до опалення та охолодження наведені як функція параметрів будівлі.
Параметри будівлі наведено.
768
Текст
Класифікація, регресія
2012
[ 357] [ 358]
A. Xifara et al.
Airfoil Self-Noise Dataset
Серія аеродинамічних та акустичних випробувань дво- та тривимірних секцій лопаті аеродинамічного профілю.
Наведено дані про частоту, кут атаки тощо.
1503
Текст
Регресія
2014
[ 359]
R. Lopez
Challenger USA Space Shuttle O-Ring Dataset
Спробуйте передбачити проблеми з ущільнювальними кільцями, враховуючи попередні дані Challenger.
Наведено кілька особливостей кожного польоту, наприклад, температура запуску.
23
Текст
Регресія
1993
[ 360] [ 361]
D. Draper et al.
Statlog (Shuttle) Dataset
Набори даних космічного човника NASA.
Надано дев’ять ознак.
58,000
Текст
Класифікація
2002
[ 362]
NASA
Астрономія
Назва
Опис
Обробка
Розмір
Формат
Задача
Створення
Посилання
Джерело
Volcanoes on Venus – JARtool experiment Dataset
Зображення Венери, отримані космічним кораблем Магеллан.
Зображення позначаються людьми.
not given
Зображення
Класифікація
1991
[ 363] [ 364]
M. Burl
MAGIC Gamma Telescope Dataset
Монте-Карло генерував події високої енергії гамма-частинок.
Численні функції, отримані з моделювання.
19,020
Текст
Класифікаціяion
2007
[ 364] [ 365]
R. Bock
Solar Flare Dataset
Вимірювання кількості певних типів сонячних спалахів, що відбуваються протягом 24 годин.
Надано багато специфічних особливостей сонячних спалахів.
1389
Текст
Розділення джерела звуку
1989
[ 366]
G. Bradshaw
CAMELS Multifield Dataset
2D-карти та 3D-сітки з тисяч N-тіл і найсучасніших гідродинамічних симуляцій, що охоплюють широкий діапазон значень космологічних і астрофізичних параметрів
Кожна карта та сітка мають 6 космологічних та астрофізичних параметрів, пов’язаних з нею
405,000 2D maps and 405,000 3D grids
2D maps and 3D grids
Регресія
2021
[ 367]
Francisco Villaescusa-Navarro et al.
Наука про Землю
Назва
Опис
Обробка
Розмір
Формат
Задачі
Створення
Посилання
Джерело
Volcanoes of the World
Дані про виверження вулканів для всіх відомих вулканічних подій на Землі.
Наведено такі деталі, як регіон, субрегіон, тектонічні умови, домінуючий тип гірських порід.
1535
Текст
Регресія, класифікація
2013
[ 368]
E. Venzke et al.
Seismic-bumps Dataset
Сейсмічна діяльність на вугільній шахті.
Сейсмічна активність була класифікована як небезпечна чи ні.
2584
Текст
Класифікація
2013
[ 369] [ 370]
M. Sikora et al.
CAMELS-US
Набір гідрологічних даних водозбору з гідрометеорологічними хронометражами та різними атрибутами
див. Посилання
671
CSV, Text, Shapefile
Регресія
2017
[ 371] [ 372]
N. Addor et al. / A. Newman et al.
CAMELS-Chile
Набір гідрологічних даних водозбору з гідрометеорологічними хронометражами та різними атрибутами
див. Посилання
516
CSV, Text, Shapefile
Регресія
2018
[ 373]
C. Alvarez-Garreton et al.
CAMELS-Brazil
Набір гідрологічних даних водозбору з гідрометеорологічними хронометражами та різними атрибутами
див. Посилання
897
CSV, Text, Shapefile
Регресія
2020
[ 374]
V. Chagas et al.
CAMELS-GB
Набір гідрологічних даних водозбору з гідрометеорологічними хронометражами та різними атрибутами
див. Посилання
671
CSV, Text, Shapefile
Регресія
2020
[ 375]
G. Coxon et al.
CAMELS-Australia
Набір гідрологічних даних водозбору з гідрометеорологічними хронометражами та різними атрибутами
див. Посилання
222
CSV, Text, Shapefile
Регресія
2021
[ 376]
K. Fowler et al.
LamaH-CE
Набір гідрологічних даних водозбору з гідрометеорологічними хронометражами та різними атрибутами
див. Посилання
859
CSV, Text, Shapefile
Регресія
2021
[ 377]
C. Klingler et al.
Інші фізичні
Назва
Опис
Обробка
Розмір
Формат
Задачі
Створений
Посилання
Джерело
Concrete Compressive Strength Dataset
Набір даних про властивості бетону та міцність на стиск.
Для кожного зразка надано дев’ять ознак.
1030
Текст
Регресія
2007
[ 378] [ 379]
I. Yeh
Concrete Slump Test Dataset
Осадка бетону наведена з точки зору властивостей.
Наведені характеристики бетону, такі як летюча зола, вода тощо.
103
Текст
Регресія
2009
[ 380] [ 381]
I. Yeh
Musk Dataset
Спрогнозуйте, чи буде молекула, враховуючи особливості, мускусом чи немускусом.
Для кожної молекули наведено 168 ознак.
6598
Текст
Класифікація
1994
[ 382]
Arris Pharmaceutical Corp.
Steel Plates Faults Dataset
Сталеві пластини 7 різних типів.
Для кожного зразка наведено 27 ознак.
1941
Текст
Класифікація
2010
[ 383]
Semeion Research Center
Біологічні дані
Набори даних з біологічних систем.
Соціальні
Назва
Опис
Обробка
Розмір
Формат
Задачі
Створення
Посилання
Джерело
Synthetic Fundus Dataset[ 384]
Фотореалістичні зображення сітківки та сегментації судин. Публічний домен.
2500 зображень з роздільністю 1500*1152 пікселів, корисних для сегментації та класифікації вен і артерій на одному фоні.
2500
Зображення
Класифікація, сегментація
2020
[ 385]
C. Valenti et al.
EEG Database
Дослідження для вивчення корелятів ЕЕГ генетичної схильності до алкоголізму.
Вимірювання за допомогою 64 електродів, розміщених на шкірі голови, відбираються при частоті 256 Гц (епоха 3,9 мс) протягом 1 секунди.
122
Текст
Класифікація
1999
[ 386]
H. Begleiter
P300 Interface Dataset
Дані від дев’яти суб’єктів, зібрані за допомогою інтерфейсу «мозок-комп’ютер» на основі P300 для суб’єктів з обмеженими можливостями.
Розділіть на чотири заняття для кожного предмета. Дано код MATLAB.
1,224
Текст
Класифікація
2008
[ 387] [ 388]
U. Hoffman et al.
Heart Disease Data Set
Приписують пацієнтів із серцевими захворюваннями та без них.
75 атрибутів, наданих для кожного пацієнта з деякими відсутніми значеннями.
303
Текст
Класифікація
1988
[ 389] [ 390]
A. Janosi et al.
Breast Cancer Wisconsin (Diagnostic) Dataset
Набір даних про особливості утворення грудей. Діагноз ставить лікар.
Наведено 10 ознак для кожного зразка.
569
Текст
Класифікація
1995
[ 391] [ 392]
W. Wolberg et al.
National Survey on Drug Use and Health
Широкомасштабне дослідження здоров'я та вживання наркотиків у Сполучених Штатах.
Немає
55,268
Текст
Класифікація, регресія
2012
[ 393]
United States Department of Health and Human Services
Lung Cancer Dataset
Набір даних про рак легенів без визначення атрибутів
Для кожного випадку наведено 56 ознак
32
Текст
Класифікація
1992
[ 394] [ 395]
Z. Hong et al.
Arrhythmia Dataset
Дані для групи пацієнтів, з яких у деяких спостерігається серцева аритмія.
276 функцій для кожного екземпляра.
452
Текст
Класифікація
1998
[ 396] [ 397]
H. Altay et al.
Diabetes 130-US hospitals for years 1999–2008 Dataset
Дані про реадмісію за 9 років у 130 американських лікарнях для пацієнтів з цукровим діабетом.
Наведено багато особливостей кожної реадмісії.
100,000
Текст
Класифікація, кластеризація
2014
[ 398] [ 399]
J. Clore et al.
Diabetic Retinopathy Debrecen Dataset
Характеристики, отримані із зображень очей з діабетичною ретинопатією та без неї.
Вилучено ознаки та діагностовано умови.
1151
Текст
Класифікація
2014
[ 400] [ 401]
B. Antal et al.
Diabetic Retinopathy Messidor Dataset
Методи оцінки методів сегментації та індексації в області офтальмології сітківки (MESSIDOR)
Характеризує ступінь ретинопатії та ризик розвитку макулярного набряку
1200
Зображення, текст
Класифікація, сегментація
2008
[ 402] [ 403]
Messidor Project
Liver Disorders Dataset
Дані для людей із захворюваннями печінки.
Для кожного пацієнта наведено сім біологічних ознак.
345
Текст
Класифікація
1990
[ 404] [ 405]
Bupa Medical Research Ltd.
Thyroid Disease Dataset
10 баз даних пацієнтів із захворюваннями щитоподібної залози.
Немає
7200
Текст
Класифікація
1987
[ 406] [ 407]
R. Quinlan
Mesothelioma Dataset
Дані пацієнтів з мезотеліомою.
Наведено велику кількість особливостей, включаючи вплив азбесту.
324
TextТекст
Класифікація2016
2016
[ 408] [ 409]
A. Tanrikulu et al.
Parkinson's Vision-Based Pose Estimation Dataset
2D оцінки пози людини пацієнтів з хворобою Паркінсона, які виконують різноманітні завдання.
Тремтіння камери вилучено з траєкторій.
134
Текст
Класифікація, регресія
2017
[ 410] [ 411] [ 412]
M. Li et al.
KEGG Metabolic Reaction Network (Undirected) Dataset
Мережа метаболічних шляхів. Дано мережу реакцій і мережу відношень.
Наведено детальні характеристики для кожного вузла мережі та шляху.
65,554
Текст
Класифікація, кластеризація, регресія
2011
[ 413]
M. Naeem et al.
Modified Human Sperm Morphology Analysis Dataset (MHSMA)
Зображення сперми людини 235 пацієнтів з чоловічим фактором безпліддя, позначені для нормальної або аномальної сперматозоїди акросоми, головки, вакуолі та хвоста.
Обрізаний навколо однієї головки сперматозоїда. Нормалізоване збільшення. Створено розділи для навчання, перевірки та тестування.
1,540
.npy files
Класифікація
2019
[ 414] [ 415]
S. Javadi and S.A. Mirroshandel
Тварини
Назва
Опис
Обробка
Розмір
Формат
Задачі
Створення
Посилання
Джерело
Abalone Dataset
Фізичні вимірювання вушка. Також вказано погодні умови та місце розташування
Немає
4177
Текст
Регресія
1995
[ 416]
Marine Research Laboratories – Taroona
Zoo Dataset
Штучний набір даних, що охоплює 7 класів тварин.
Тварини поділяються на 7 категорій, для кожної наведені особливості.
101
Текст
Класифікація
1990
[ 417]
R. Forsyth
Demospongiae Dataset
Дані про морських губках.
503 губки класу Demosponge описуються різними ознаками.
503
Текст
Класифікація
2010
[ 418]
E. Armengol et al.
Farm animals data
Інвентаризація даних PLF (корови, свині; розташування, прискорення тощо).
Марковані набори даних.
Список постійно оновлюється
Текст
Класифікація
2020
[ 419]
V. Bloch
Splice-junction Gene Sequences Dataset
Послідовності генів з’єднання приматів (ДНК) з асоційованою недосконалою теорією домену.
Немає
3190
Текст
Класифікація
1992
[ 395]
G. Towell et al.
Mice Protein Expression Dataset
Рівні експресії 77 білків виміряли в корі головного мозку мишей.
Немає
1080
Текст
Класифікація, кластеризація
2015
[ 420] [ 421]
C. Higuera et al.
Гибкий
Назва
Опис
Обробка
Розмір
Формат
Задачі
Створення
Посилання
Джерело
UCI Mushroom Dataset
Ознаки та класифікація грибів
Наведено багато властивостей кожного гриба.
8124
Текст
Класифікація
1987
[ 422]
J. Schlimmer
Secondary Mushroom Dataset
Ознаки та класифікація грибів
Змодельовані дані з більших і реалістичніших первинних записів грибів. Повністю відтворюваний.
61069
Текст
Класифікація
2020
[ 423] [ 424]
D. Wagner et al.
Рослини
Назва
Опис
Обробка
Розмір
Формат
Задачі
Створення
Посилання
Джерело
Forest Fires Dataset
Лісові пожежі та їх властивості.
Вилучено 13 ознак кожної пожежі.
517
Текст
Регресія
2008
[ 425] [ 426]
P. Cortez et al.
Іриси Фішера
Три типи ірисів описуються 4 різними ознаками.
Немає
150
Текст
Класифікація
1936
[ 427] [ 428]
R. Fisher
Plant Species Leaves Dataset
Шістнадцять зразків листя кожного із ста видів рослин.
Дано дескриптор форми, дрібномасштабне поле та гістограми текстури.
1600
Текст
Класифікація
2012
[ 429] [ 430]
J. Cope et al.
Soybean Dataset
База даних хворих рослин сої.
Наведено 35 ознак для кожної рослини. Рослини поділяються на 19 категорій.
307
Текст
Класифікація
1988
[ 431]
R. Michalski et al.
Seeds Dataset
Вимірювання геометричних властивостей ядер трьох різних сортів пшениці.
Немає
210
Текст
Класифікація, кластеризація
2012
[ 432] [ 433]
Charytanowicz et al.
Covertype Dataset
мДані для прогнозування типу лісистості суворо на основі картографічних змінних.
Наведено багато географічних об’єктів.
581,012
Текст
Класифікація
1998
[ 434] [ 435]
J. Blackard et al.
Abscisic Acid Signaling Network Dataset
Дані для мережі сигналізації заводу. Мета – визначити набір правил, які керують мережею.
Немає
300
Текст
Причинно-відкриття
2008
[ 436]
J. Jenkens et al.
Folio Dataset
20 фотографій листя для кожного з 32 видів.
Немає
637
Зображення, текст
Класифікація, виявлення
2015
[ 437] [ 438]
T. Munisami et al.
Oxford Flower Dataset
Набір даних квітів 17 категорії.
Розділи поїздів/тестів, позначені зображення,
1360
Зображення, текст
Класифікація
2006
[ 146] [ 439]
M-E Nilsback et al.
Plant Seedlings Dataset
Набір даних 12 категорії саджанців рослин.
Марковані зображення, сегментовані зображення,Марковані зображення, сегментовані зображення,
5544
Зображення
Класифікація, виявлення
2017
[ 440]
Giselsson et al.
Fruits 360 dataset
База даних із зображеннями 120 фруктів і овочів.
100x100 пікселів, білий фон.
82213
Зображення(jpg)
Класифікація
2017–2019
[ 441] [ 442]
Mihai Oltean, Horea Muresan
Мікроб
Назва
Опис
Обробка
Розмір
Формат
Задачі
Створення
Посилання
Джерело
Ecoli Dataset
Місця локалізації білків.
Наведено різні особливості місць локалізації білків.
336
Текст
Класифікація
1996
[ 443] [ 444]
K. Nakai et al.
MicroMass Dataset
Ідентифікація мікроорганізмів за даними мас-спектрометрії.
Різні функції мас-спектрометра.
931
Текст
Класифікація
2013
[ 445] [ 446]
P. Mahe et al.
Yeast Dataset
Прогнозування клітинної локалізації білків.
Вісім функцій наведено для кожного випадку.
1484
Текст
Класифікація
1996
[ 447] [ 448]
K. Nakai et al.
Відкриття наркотиків
Назва
Опис
Обробка
Розмір
Формат
Задачі
Створення
Посилання
Джерело
Tox21 Dataset
Прогнозування результатів біологічних аналізів.
Наведено хімічні дескриптори молекул
12707
Текст
Класифікація
2016
[ 449]
A. Mayr et al.
Дані про аномалії
Назва
Опис
Обробка
Розмір
Формат
Задачі
Створення
Посилання
Джерело
Numenta Anomaly Benchmark (NAB)
Дані впорядковані, з мітками часу, однозначні метрики. Усі файли даних містять аномалії, якщо не зазначено інше.
Немає
50+ files
Значення, розділені комами
Виявлення аномалій
2016 (постійно оновлюється)
[ 450]
Numenta
Skoltech Anomaly Benchmark (SKAB)
Кожен файл представляє один експеримент і містить одну аномалію. Набір даних являє собою багатоваріантний часовий ряд, зібраний із датчиків, встановлених на тестовому стенді.
Є дві розмітки для проблем виявлення викидів (точкові аномалії) та виявлення точок змін (колективні аномалії).
30+ files (v0.9)
Значення, розділені комами
Виявлення аномалій
2020 (постійно оновлюється)
[ 451] [ 452]
Iurii D. Katser and Vyacheslav O. Kozitsin
On the Evaluation of Unsupervised Outlier Detection: Measures, Datasets, and an Empirical Study
Більшість файлів даних адаптовано з даних репозитарію машинного навчання UCI, деякі зібрані з літератури.
обробляються відсутні значення, лише числові атрибути, різні відсотки аномалій, мітки
1000+ files
ARFF
Виявлення аномалій
2016 (можливо, оновлено новими наборами даних та/або результатами)
[ 453]
Campos et al.
Відповіді на питання
Цей розділ містить набори даних, які мають справу зі структурованими даними.
Назва
Опис
Обробка
Розмір
Формат
Задачі
Створення
Посилання
Джерело
DBpedia Neural Question Answering (DBNQA) Dataset
Велика колекція Question to SPARQL, спеціально розроблена для відповіді на нейронні запитання відкритого домену через базу знань DBpedia.
Цей набір даних містить велику колекцію відкритих шаблонів Neural SPARQL та екземплярів для навчання машин Neural SPARQL; він був попередньо оброблений напівавтоматичними інструментами анотації, а також трьома експертами SPARQL.
894,499
Пари питання-запит
Відповідь на запитання
2018
[ 454] [ 455]
Hartmann, Soru, and Marx et al.
Vietnamese Question Answering Dataset (UIT-ViQuAD)
Велика колекція в'єтнамських питань для оцінки моделей MRC.
Цей набір даних містить понад 23 000 створених людьми пар питань і відповідей на основі 5 109 уривків із 174 в’єтнамських статей з Вікіпедії.
23,074
Пари питання-запит
Відповідь на запитання
2020
[ 456]
Nguyen et al.
Vietnamese Multiple-Choice Machine Reading Comprehension Corpus(ViMMRC)
Колекція в’єтнамських питань з кількома відповідями для оцінки моделей MRC.
Цей корпус включає 2783 в’єтнамські запитання з кількома відповідями.
2,783
Пари питання-запит
Відповідь на запитання/Машинне розуміння прочитаного
2020
[ 457]
Nguyen et al.
Багатоваріантні дані
Набори даних, що складаються з рядків спостережень і стовпців атрибутів, що характеризують ці спостереження. Зазвичай використовується для регресійного аналізу або класифікації, але можуть використовуватися й інші типи алгоритмів. Цей розділ містить набори даних, які не вписуються в вищезазначені категорії.
Фінанси
Назва
Опис
Обробка
Розмір
Формат
Задачі
Створення
Посилання
Джерело
Dow Jones Index
Щотижневі дані запасів за І-ІІ квартали 2011 року.
Розраховані значення включали такі, як відсоткова зміна та лаги.
750
Значення, розділені комами
Класифікація, регресія, часові ряди
2014
[ 458] [ 459]
M. Brown et al.
Statlog (Australian Credit Approval)
Заявки на кредитні картки прийняті або відхилені та атрибути програми.
Назви атрибутів видаляються, а також ідентифікаційна інформація. Фактори були перемарковані.
690
Значення, розділені комами
Класифікація
1987
[ 460] [ 461]
R. Quinlan
eBay auction data
Дані аукціону з різних об’єктів eBay.com на аукціонах різної тривалості
Містить усі ставки, ідентифікатор ставки, час ставок та ціни відкриття.
~ 550
Текст
Регресія, класифікація
2012
[ 462] [ 463]
G. Shmueli [en] et al.
Statlog (German Credit Data)
Бінарна класифікація кредиту на «хороша» або «погана» з багатьма ознаками
Наведено різні фінансові особливості кожної людини.
690
Текст
Класифікація
1994
[ 464]
H. Hofmann
Bank Marketing Dataset
Дані великої маркетингової кампанії, проведеної великим банком.
Наведено багато атрибутів клієнтів, до яких звертаються. Якщо клієнт підписався на банк також надається.
45,211
Текст
Класифікація
2012
[ 465] [ 466]
S. Moro et al.
Istanbul Stock Exchange Dataset
Декілька фондових індексів відстежувалися майже два роки.
Немає
536
Текст
Класифікація, регресія
2013
[ 464] [ 467]
O. Akbilgic
Default of Credit Card Clients
Дані про дефолт для тайванських кредиторів.
Для кожного облікового запису надаються різні функції.
30,000
Текст
Класифікація
2016
[ 468] [ 469]
I. Yeh
Погода
Назва
Опис
Обробка
Розмір
Формат
Задачі
Створенная
Посилання
Джерело
Cloud DataSet
Дані про 1024 різних хмарах.
Вилучено характеристики зображення.
1024
Текст
Класифікація, кластеризація
1989
[ 470]
P. Collard
El Nino Dataset
Океанографічні та приземні метеорологічні показання, отримані з серії буїв, розташованих по всій екваторіальній частині Тихого океану.
На кожному буї вимірюється 12 погодних атрибутів.
178080
Текст
Регресія
1999
[ 471]
Pacific Marine Environmental Laboratory [en]
Greenhouse Gas Observing Network Dataset
Часовий ряд концентрацій парникових газів у 2921 осередку сітки в Каліфорнії створений за допомогою моделювання погоди.
Немає
2921
Текст
Регресія
2015
[ 472]
D. Lucas
Atmospheric CO2 from Continuous Air Samples at Mauna Loa Observatory
Безперервні проби повітря на Гаваях, США. 44 роки рекордів.
Немає
44 years
Текст
Регресія
2001
[ 473]
Mauna Loa Observatory [en]
Ionosphere Dataset
Радарні дані з іоносфери. Завдання — розділити на хороші та погані результати радіолокації.
Немає
351
Текст
Класифікація
1989
[ 407] [ 474]
Johns Hopkins University
Ozone Level Detection Dataset
Два набори даних про рівень озону на землі.
Надано багато функцій, включаючи погодні умови на момент вимірювання.
2536
Текст
Класифікація
2008
[ 464] [ 475]
K. Zhang et al.
Перепис населення
Назва
Опис
Обробка
Розмір
Формат
Задачі
Створенная
Посилання
Джерело
Adult Dataset
Дані перепису 1994 року, що містять демографічні ознаки дорослих та їхні доходи.
Очищено та анонімно.
48,842
Значення, розділені комами
Класифікація
1996
[ 476]
United States Census Bureau
Census-Income (KDD)
Зважені дані перепису з поточних опитувань населення 1994 та 1995 років.
Розділіть на навчальні та тестові набори.
299,285
Значення, розділені комами
Класифікація
2000
[ 477] [ 478]
United States Census Bureau
IPUMS Census Database
Дані перепису з районів Лос-Анджелеса та Лонг-Біч.
Немає
256,932
Текст
Класифікація, регресія
1999
[ 479]
IPUMS [en]
US Census Data 1990
Часткові дані перепису населення США 1990 року.
Результати рандомізовані та вибрані корисні атрибути.
2,458,285
Текст
Класифікація, регресія
1990
[ 480]
United States Census Bureau
Транзит
Назва
Опис
Обробка
Розмір
Формат
Задачі
Створення
Посилання
Джерело
Bike Sharing Dataset
Погодинний і добовий підрахунок прокату велосипедів у великому місті.
Надано багато функцій, включаючи погоду, тривалість подорожі тощо.
17,389
Текст
Регресія
2013
[ 481] [ 482]
H. Fanaee-T
New York City Taxi Trip Data
Дані про подорожі жовтих і зелених таксі в Нью-Йорку.
Вказує місця посадки та висадки, тарифи та інші деталі поїздок.
6 years
Текст
Класифікація, кластеризація
2015
[ 483]
New York City Taxi and Limousine Commission [en]
Taxi Service Trajectory ECML PKDD
Траєкторії всіх таксі у великому місті.
Надано багато функцій, включаючи точки початку та зупинки.
1,710,671
Текст
Кластеризація, причинно-наслідкове відкриття
2015
[ 484] [ 485]
M. Ferreira et al.
METR-LA
Швидкість від петлеві детекторів на шосе округу Лос-Анджелес..
Середня швидкість за 5 хвилин.
7 094 304 з 207 датчиків і 34 272 кроків
Значення, розділені комами
Регресія, прогнозування
2014
[ 486]
Jagadish et al.
PeMS
Швидкість, потік, зайнятість та інші показники від петлевих детекторів та інших датчиків на автостраді штату Каліфорнія, США.
Показник зазвичай зводиться до середнього з 5-хвилинними часовими кроками.
39 000 індивідуальних детекторів, кожен із яких містить ряди часу
Значення, розділені комами
Регресія, прогнозування, прогнозування, інтерполяція
(оновлено в режимі реального часу)
[ 487]
California Department of Transportation
Інтернет
Назва
Опис
Обробка
Розмір
Формат
Задачі
Створення
Посилання
Джерело
Webpages from Common Crawl 2012
Велика колекція веб-сторінок і спосіб їх з’єднання за допомогою гіперпосилань
Немає
3.5B
Текст
кластеризація, класифікація
2013
[ 488]
V. Granville
Internet Advertisements Dataset
Набір даних для прогнозування того, чи є дане зображення рекламою чи ні.
Функції кодують геометрію оголошень і фраз, що зустрічаються в URL-адресі.
3279
Текст
Класифікація
1998
[ 464] [ 489]
N. Kushmerick
Internet Usage Dataset
Загальна демографічна характеристика користувачів Інтернету.
Немає
10,104
Текст
Класифікація, кластеризація
1999
[ 490]
D. Cook
URL Dataset
120 днів URL-адрес великої конференції.
Наведено багато функцій кожної URL-адреси.
2,396,130
Текст
Класифікація
2009
[ 491] [ 492]
J. Ma
Phishing Websites Dataset
Набір даних фішингових веб-сайтів.
МНаведено багато функцій кожного сайту.
2456
Текст
Класифікація
2015
[ 493]
R. Mustafa et al.
Online Retail Dataset
Онлайн-транзакції для британського інтернет-магазину.
Дані деталі кожної транзакції.
541,909
Текст
Класифікація, кластеризація
2015
[ 494]
D. Chen
Freebase Simple Topic Dump
Freebase — це онлайн-інструмент структурування всіх людських знань.
Теми з Freebase були вилучені.
багато
Текст
Класифікація, кластеризація
2011
[ 464] [ 495]
Freebase
Farm Ads Dataset
Текст реклами ферми з сайтів. Надається бінарне схвалення або відхилення власниками вмісту.
Розраховані SVMlight розріджені вектори текстових слів в оголошеннях.
4143
Текст
Класифікація
2011
[ 496] [ 497]
C. Masterharm et al.
Ігри
Назва
Опис
Обробка
Розмір
Формат
Задачі
Створення
Посилання
Джерело
Poker Hand Dataset
5 карткових рук із стандартної колоди з 52 карт.
Надаються атрибути кожної руки, включаючи покерні руки, утворені картами, які вона містить.
1,025,010
Текст
Регресія, класифікація
2007
[ 498]
R. Cattral
Connect-4 Dataset
Містить усі дозволені 8-шарові позиції в грі Connect-4, в якій жоден із гравців ще не виграв і в якій наступний хід не вимушений.
Немає
67,557
Текст
Класифікація
1995
[ 499]
J. Tromp
Chess (King-Rook vs. King) Dataset
База даних фіналу для білого короля та лади проти чорного короля.
Немає
28,056
Текст
Класифікація
1994
[ 500] [ 501]
M. Bain et al.
Chess (King-Rook vs. King-Pawn) Dataset
King+Rook versus King+Pawn on a7.
Немає
3196
Текст
Класифікація
1989
[ 501]
R. Holte
Tic-Tac-Toe Endgame Dataset
Бінарна класифікація умов виграшу в хрестики-нулики.
Немає
958
Текст
Класифікація
1991
[ 502]
D. Aha
Інші багатоваріантості
Назва
Опис
Обробка
Розмір
Формат
Задачі
Створення
Посилання
Джерело
Housing Data Set
Середні значення будинку в Бостоні з пов’язаними атрибутами будинку та району.
Немає
506
Текст
Регресія
1993
[ 503]
D. Harrison et al.
The Getty Vocabularies
структурована термінологія художньої та іншої матеріальної культури, архівні матеріали, візуальні сурогати та бібліографічні матеріали.
Немає
багато
Текст
Класифікація
2015
[ 504]
Getty Center
Yahoo! Front Page Today Module User Click Log
Журнал кліків користувача для статей новин, які відображаються на вкладці "Вибрані" модуля Today на Yahoo! Титульна сторінка.
Сумісний аналіз з білінійною моделлю.
45 811 883 відвідування користувачів
Текст
Регресія, кластеризація
2009
[ 505] [ 506]
Chu et al.
British Oceanographic Data Centre
Біологічні, хімічні, фізичні та геофізичні дані для океанів. Відстежено 22 тис. змінних.
Різні.
22 тис. змінних, багато екземплярів
Текст
Регресія, кластеризація
2015
[ 507]
British Oceanographic Data Centre [en]
Congressional Voting Records Dataset
Дані голосування всіх представників США з 16 питань.
Детально записуються про використання програм кожним користувачем.
435
Текст
Класифікація
1987
[ 508]
J. Schlimmer
Entree Chicago Recommendation Dataset
Запис взаємодії користувачів із системою рекомендацій Entree Chicago.
Детально записуються дані про використання програми кожним користувачем.
50,672
Текст
Регресія, рекомендація
2000
[ 509]
R. Burke
Insurance Company Benchmark (COIL 2000)
Інформація про клієнтів страхової компанії.
Багато функцій кожного клієнта та послуг, якими вони користуються.
9,000
Текст
Регресія, класифікація
2000
[ 510] [ 511]
P. van der Putten
Nursery Dataset
Дані від абітурієнтів до дитячих садків.
Включаються дані про сім'ю заявника та різні інші фактори.
12,960
Текст
Класифікація
1997
[ 512] [ 513]
V. Rajkovic et al.
University Dataset
Дані, що описують атрибути великої кількості університетів.
Немає
285
Текст
Класифікація, кластеризація
1988
[ 514]
S. Sounders et al.
Blood Transfusion Service Center Dataset
Дані центру переливання крові. Надає дані про швидкість повернення донорів, частоту тощо.
Немає
748
Текст
Класифікація
2008
[ 515] [ 516]
I. Yeh
Record Linkage Comparison Patterns Dataset
Великий набір записів. Завдання — зв’язати між собою відповідні записи.
Процедура блокування застосовується для вибору лише певних пар записів.
5,749,132
Текст
Класифікація
2011
[ 517] [ 518]
University of Mainz
Nomao Dataset
Nomao збирає дані про місця з багатьох різних джерел. Завдання — виявити предмети, які описують одне й те саме місце.
Позначені копії.
34,465
Текст
Класифікація
2012
[ 519] [ 520]
Nomao Labs
Movie Dataset
Дані для 10 000 фільмів.
Для кожного фільму надано кілька функцій.
10,000
Текст
Класифікація, кластеризація
1999
[ 521]
G. Wiederhold
Open University Learning Analytics Dataset
Інформація про студентів та їх взаємодію з віртуальним навчальним середовищем.
Жодного
~ 30,000
Текст
Класифікація, кластеризація, регресія
2015
[ 522] [ 523]
J. Kuzilek et al.
Mobile phone records
Телекомунікаційна діяльність та взаємодії
Агрегація за клітинками географічної сітки та кожні 15 хвилин.
великий
Текст
Класифікація, кластеризація, регресія
2015
[ 524]
G. Barlacchi et al.
Кураторські сховища наборів даних
Оскільки набори даних бувають у безлічі форматів і іноді можуть бути важкими у використанні, була проведена значна робота в організації та стандартизації формату наборів даних, щоб полегшити їх використання для дослідження машинного навчання.
OpenML:[ 525] веб-платформа з Python, R, Java та іншими API для завантаження сотень наборів даних машинного навчання, оцінки алгоритмів у наборах даних і порівняння продуктивності алгоритму з десятками інших алгоритмів.
PMLB:[ 526] велике сховище контрольних наборів даних для оцінки контрольованих алгоритмів машинного навчання. Забезпечує набори даних класифікації та регресії в стандартизованому форматі, які доступні через API Python.
Metatext NLP: веб-сховище https://metatext.io/datasets , яке обслуговується спільнотою, містить майже 1000 контрольних наборів даних і збільшується. Надає багато завдань від класифікації до QA, а також різні мови від англійської, португальської до арабської.
Appen [en] : Off the Shelf and Open Source Datasets, розміщені та підтримувані компанією. Ці біологічні, графічні, фізичні, відповіді на запитання, сигнальні, звукові, текстові та відеоресурси налічують понад 250 і їх можна застосувати до більш ніж 25 різних випадків використання[ 527] .[ 527]
Дивись також
Примітки
↑ Edge.org . www.edge.org . Процитовано 24 травня 2022 .
↑ Weiss, G. M.; Provost, F. (1 жовтня 2003). Learning When Training Data are Costly: The Effect of Class Distribution on Tree Induction . Journal of Artificial Intelligence Research (англ.) . Т. 19. с. 315—354. doi :10.1613/jair.1199 . ISSN 1076-9757 . Процитовано 24 травня 2022 .
↑ Turney, Peter D. (11 грудня 2002). Types of Cost in Inductive Concept Learning . arXiv:cs/0212034 . Процитовано 24 травня 2022 .
↑ Turney, Peter D. (11 грудня 2002). Types of Cost in Inductive Concept Learning . arXiv:cs/0212034 . Процитовано 25 травня 2022 .
↑ Žliobaitė, Indrė; Bifet, Albert; Pfahringer, Bernhard; Holmes, Geoff (2011). Gunopulos, Dimitrios (ред.). Active Learning with Evolving Streaming Data . Machine Learning and Knowledge Discovery in Databases (англ.) . Springer. с. 597—612. doi :10.1007/978-3-642-23808-6_39 . ISBN 978-3-642-23808-6 . Процитовано 24 травня 2022 .
↑ Zafeiriou, Stefanos; Kollias, Dimitrios; Nicolaou, Mihalis A.; Papaioannou, Athanasios; Zhao, Guoying; Kotsia, Irene (2017-07). Aff-Wild: Valence and Arousal ‘In-the-Wild’ Challenge . 2017 IEEE Conference on Computer Vision and Pattern Recognition Workshops (CVPRW) . с. 1980—1987. doi :10.1109/CVPRW.2017.248 . Процитовано 25 травня 2022 .
↑ Kollias, Dimitrios; Tzirakis, Panagiotis; Nicolaou, Mihalis A.; Papaioannou, Athanasios; Zhao, Guoying; Schuller, Björn; Kotsia, Irene; Zafeiriou, Stefanos (1 червня 2019). Deep Affect Prediction in-the-Wild: Aff-Wild Database and Challenge, Deep Architectures, and Beyond . International Journal of Computer Vision (англ.) . Т. 127, № 6. с. 907—929. doi :10.1007/s11263-019-01158-4 . ISSN 1573-1405 . Процитовано 25 травня 2022 .
↑ Kollias, Dimitrios; Zafeiriou, Stefanos (25 вересня 2019). Expression, Affect, Action Unit Recognition: Aff-Wild2, Multi-Task Learning and ArcFace . arXiv:1910.04855 [cs, eess] . Процитовано 25 травня 2022 .
↑ Kollias, D.; Schulc, Attila; Hajiyev, Elnar; Zafeiriou, S. (2020). Analysing Affective Behavior in the First ABAW 2020 Competition . 2020 15th IEEE International Conference on Automatic Face and Gesture Recognition (FG 2020) . doi :10.1109/FG47880.2020.00126 . Процитовано 25 травня 2022 .
↑ Wiskott, Laurenz, et al. «Face recognition by elastic bunch graph matching.»Pattern Analysis and Machine Intelligence, IEEE Transactions on 19.7 (1997): 775—779.
↑ Wiskott, L.; Krüger, Norbert; Kuiger, N.; von der Malsburg, C. (1997-07). Face recognition by elastic bunch graph matching . IEEE Transactions on Pattern Analysis and Machine Intelligence . Т. 19, № 7. с. 775—779. doi :10.1109/34.598235 . ISSN 1939-3539 . Процитовано 27 травня 2022 .
↑ Livingstone, Steven R.; Russo, Frank A. (16 трав. 2018 р.). The Ryerson Audio-Visual Database of Emotional Speech and Song (RAVDESS): A dynamic, multimodal set of facial and vocal expressions in North American English . PLOS ONE (англ.) . Т. 13, № 5. с. e0196391. doi :10.1371/journal.pone.0196391 . ISSN 1932-6203 . PMC 5955500 . PMID 29768426 . Процитовано 28 травня 2022 . {{cite news }}
: Обслуговування CS1: Сторінки з PMC з іншим форматом (посилання ) Обслуговування CS1: Сторінки із непозначеним DOI з безкоштовним доступом (посилання )
↑ Livingstone, Steven R.; Russo, Frank A. (5 квітня 2018), The Ryerson Audio-Visual Database of Emotional Speech and Song (RAVDESS) , Zenodo, doi :10.5281/zenodo.1188976 , процитовано 28 травня 2022
↑ Grgic, Mislav, Kresimir Delac, and Sonja Grgic. «SCface–surveillance cameras face database.» Multimedia tools and applications 51.3 (2011): 863—879.
↑ Wallace, Roy, et al. «Inter-session variability modelling and joint factor analysis for face authentication.» Biometrics (IJCB), 2011 International Joint Conference on . IEEE, 2011.
↑ Georghiades, A. "Yale face database". Center For Computational Vision And Control At Yale University, .
↑ Nguyen, D.; Halupka, D.; Aarabi, P.; Sheikholeslami, A. (2006-08). Real-time face detection and lip feature extraction using field-programmable gate arrays . IEEE Transactions on Systems, Man, and Cybernetics, Part B (Cybernetics) . Т. 36, № 4. с. 902—912. doi :10.1109/TSMCB.2005.862728 . ISSN 1941-0492 . Процитовано 28 травня 2022 .
↑ Kanade, T.; Cohn, J.F.; Yingli Tian. Comprehensive database for facial expression analysis . Proceedings Fourth IEEE International Conference on Automatic Face and Gesture Recognition (Cat. No. PR00580) . IEEE Comput. Soc. doi :10.1109/afgr.2000.840611 . Процитовано 28 травня 2022 .
↑ Zeng, Zhihong; Pantic, Maja; Roisman, Glenn I.; Huang, Thomas S. (2009-01). A Survey of Affect Recognition Methods: Audio, Visual, and Spontaneous Expressions . IEEE Transactions on Pattern Analysis and Machine Intelligence . Т. 31, № 1. с. 39—58. doi :10.1109/TPAMI.2008.52 . ISSN 1939-3539 . Процитовано 28 травня 2022 .
↑ Lyons, Michael; Kamachi, Miyuki; Gyoba, Jiro (14 квітня 1998), The Japanese Female Facial Expression (JAFFE) Dataset , Zenodo, doi :10.5281/zenodo.3451524 , процитовано 28 травня 2022
↑ Lyons, M.; Akamatsu, S.; Kamachi, M.; Gyoba, J. Coding facial expressions with Gabor wavelets . Proceedings Third IEEE International Conference on Automatic Face and Gesture Recognition . IEEE Comput. Soc. doi :10.1109/afgr.1998.670949 . Процитовано 28 травня 2022 .
↑ Ng, Hong-Wei; Winkler, Stefan (2014-10). A data-driven approach to cleaning large face datasets . 2014 IEEE International Conference on Image Processing (ICIP) . IEEE. doi :10.1109/icip.2014.7025068 . Процитовано 28 травня 2022 .
↑ RoyChowdhury, Aruni; Lin, Tsung-Yu; Maji, Subhransu; Learned-Miller, Erik (28 березня 2016). One-to-many face recognition with bilinear CNNs . arXiv:1506.01342 [cs] . Процитовано 28 травня 2022 .
↑ Jesorsky, Oliver; Kirchberg, Klaus J.; Frischholz, Robert W. (2001). Robust Face Detection Using the Hausdorff Distance . Lecture Notes in Computer Science. Berlin, Heidelberg: Springer Berlin Heidelberg. с. 90—95. ISBN 978-3-540-42216-7 .
↑ Karam, Lina J.; Zhu, Tong (17 березня 2015). Quality labeled faces in the wild (QLFW): a database for studying face recognition in real-world environments . Human Vision and Electronic Imaging XX . SPIE. doi :10.1117/12.2080393 . Процитовано 28 травня 2022 .
↑ Bhatt, Rajen B.; Sharma, Gaurav; Dhall, Abhinav; Chaudhury, Santanu (2009). Efficient Skin Region Segmentation Using Low Complexity Fuzzy Decision Tree Model . 2009 Annual IEEE India Conference . IEEE. doi :10.1109/indcon.2009.5409447 . Процитовано 28 травня 2022 .
↑ Lingala, Mounika; Joe Stanley, R.; Rader, Ryan K.; Hagerty, Jason; Rabinovitz, Harold S.; Oliviero, Margaret; Choudhry, Iqra; Stoecker, William V. (1 липня 2014). Fuzzy logic color detection: Blue areas in melanoma dermoscopy images . Computerized Medical Imaging and Graphics (англ.) . Т. 38, № 5. с. 403—410. doi :10.1016/j.compmedimag.2014.03.007 . ISSN 0895-6111 . PMC 4287461 . PMID 24786720 . Процитовано 28 травня 2022 . {{cite news }}
: Обслуговування CS1: Сторінки з PMC з іншим форматом (посилання )
↑ Maes, Chris; Fabry, Thomas; Keustermans, Johannes; Smeets, Dirk; Suetens, Paul; Vandermeulen, Dirk (2010-09). Feature detection on 3D face surfaces for pose normalisation and recognition . 2010 Fourth IEEE International Conference on Biometrics: Theory, Applications and Systems (BTAS) . IEEE. doi :10.1109/btas.2010.5634543 . Процитовано 28 травня 2022 .
↑ Savran, Arman; Alyüz, Neşe; Dibeklioğlu, Hamdi; Çeliktutan, Oya; Gökberk, Berk; Sankur, Bülent; Akarun, Lale (2008). Bosphorus Database for 3D Face Analysis . Lecture Notes in Computer Science. Berlin, Heidelberg: Springer Berlin Heidelberg. с. 47—56. ISBN 978-3-540-89990-7 .
↑ Heseltine, T.; Pears, N.; Austin, J. Three-dimensional face recognition: an eigensurface approach . 2004 International Conference on Image Processing, 2004. ICIP '04 . IEEE. doi :10.1109/icip.2004.1419769 . Процитовано 28 травня 2022 .
↑ Ge, Yun; et al. (2011). "3D Novel Face Sample Modeling for Face Recognition". Journal of Multimedia . ojs.academypublisher.com . doi :10.4304/jmm.6.5.467-475 . Процитовано 28 травня 2022 .
↑ Wang, Yueming, Jianzhuang Liu, and Xiaoou Tang. «Robust 3D face recognition by local shape difference boosting.» Pattern Analysis and Machine Intelligence, IEEE Transactions on 32.10 (2010): 1858—1870.
↑ Zhong, Cheng, Zhenan Sun, and Tieniu Tan. «Robust 3D face recognition using learned visual codebook.» Computer Vision and Pattern Recognition, 2007. CVPR'07. IEEE Conference on . IEEE, 2007.
↑ Zhao, G., Huang, X., Taini, M., Li, S. Z., & Pietikäinen, M. (2011). Facial expression recognition from near-infrared videos. Image and Vision Computing, 29(9), 607—619.
↑ Soyel, Hamit, and Hasan Demirel. «Facial expression recognition using 3D facial feature distances.» Image Analysis and Recognition . Springer Berlin Heidelberg, 2007. 831—838.
↑ Bowyer, Kevin W., Kyong Chang, and Patrick Flynn. «A survey of approaches and challenges in 3D and multi-modal 3D+ 2D face recognition.» Computer vision and image understanding 101.1 (2006): 1-15.
↑ Tan, Xiaoyang, and Bill Triggs. «Enhanced local texture feature sets for face recognition under difficult lighting conditions.» Image Processing, IEEE Transactions on 19.6 (2010): 1635—1650.
↑ Mousavi, Mir Hashem, Karim Faez, and Amin Asghari. «Three dimensional face recognition using SVM classifier.» Computer and Information Science, 2008. ICIS 08. Seventh IEEE/ACIS International Conference on . IEEE, 2008.
↑ Amberg, Brian, Reinhard Knothe, and Thomas Vetter. «Expression invariant 3D face recognition with a morphable model.» Automatic Face & Gesture Recognition, 2008. FG'08. 8th IEEE International Conference on . IEEE, 2008.
↑ İrfanoğlu, M. O., Berk Gökberk, and Lale Akarun. «3D shape-based face recognition using automatically registered facial surfaces.» Pattern Recognition, 2004. ICPR 2004. Proceedings of the 17th International Conference on . Vol. 4. IEEE, 2004.
↑ Beumier, Charles, and Marc Acheroy. «Face verification from 3D and grey level clues.» Pattern recognition letters 22.12 (2001): 1321—1329.
↑ Computer Science . arxiv.org . Процитовано 28 травня 2022 .
↑ SoF dataset . sites.google.com (укр.) . Процитовано 28 травня 2022 .
↑ IMDB-WIKI - 500k+ face images with age and gender labels . data.vision.ee.ethz.ch . Процитовано 28 травня 2022 .
↑ Patron-Perez, Alonso; Marszalek, Marcin; Reid, Ian; Zisserman, Andrew (2012-12). Structured Learning of Human Interactions in TV Shows . IEEE Transactions on Pattern Analysis and Machine Intelligence . Т. 34, № 12. с. 2441—2453. doi :10.1109/TPAMI.2012.24 . ISSN 1939-3539 . Процитовано 20 травня 2022 .
↑ Ofli, Ferda; Chaudhry, Rizwan; Kurillo, Gregorij; Vidal, Rene; Bajcsy, Ruzena (2013-01). Berkeley MHAD: A comprehensive Multimodal Human Action Database . 2013 IEEE Workshop on Applications of Computer Vision (WACV) . IEEE. doi :10.1109/wacv.2013.6474999 . Процитовано 20 травня 2022 .
↑ N.Z.), Asian Conference on Pattern Recognition (5th : 2019 : Auckland,. Pattern recognition : 5th Asian Conference, ACPR 2019, Auckland, New Zealand, November 26-29, 2019, Revised selected papers . ISBN 978-3-030-41299-9 . OCLC 1142374420 .
↑ Feichtenhofer, Christoph; Pinz, Axel; Zisserman, Andrew (2016-06). Convolutional Two-Stream Network Fusion for Video Action Recognition . 2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR) . IEEE. doi :10.1109/cvpr.2016.213 . Процитовано 28 травня 2022 .
↑ Rama., Zhao, Wenyi. Chellappa,. Face processing : advanced modeling and methods . ISBN 978-0-08-048884-4 . OCLC 953864701 .
↑ Krishna, Ranjay; Zhu, Yuke; Groth, Oliver; Johnson, Justin; Hata, Kenji; Kravitz, Joshua; Chen, Stephanie; Kalantidis, Yannis; Li, Li-Jia; Shamma, David A; Bernstein, Michael S; Fei-Fei, Li (2017). Visual Genome: Connecting Language and Vision Using Crowdsourced Dense Image Annotations. International Journal of Computer Vision . 123 : 32—73. arXiv :1602.07332 . doi :10.1007/s11263-016-0981-7 .
↑ Karayev, S., et al. «A category-level 3-D object dataset: putting the Kinect to work [Архівовано 21 грудня 2019 у Wayback Machine .] .» Proceedings of the IEEE International Conference on Computer Vision Workshops . 2011.
↑ Tighe, Joseph, and Svetlana Lazebnik. «Superparsing: scalable nonparametric image parsing with superpixels [Архівовано 6 серпня 2019 у Wayback Machine .] .» Computer Vision–ECCV 2010 . Springer Berlin Heidelberg, 2010. 352—365.
↑ Arbelaez, P.; Maire, M; Fowlkes, C; Malik, J (May 2011). Contour Detection and Hierarchical Image Segmentation (PDF) . IEEE Transactions on Pattern Analysis and Machine Intelligence . 33 (5): 898—916. doi :10.1109/tpami.2010.161 . PMID 20733228 . Архів оригіналу (PDF) за 8 травня 2012. Процитовано 27 лютого 2016 .
↑ Lin, Tsung-Yi, et al. «Microsoft coco: Common objects in context .» Computer Vision–ECCV 2014 . Springer International Publishing, 2014. 740—755.
↑ а б Russakovsky, Olga; Deng, Jia; Su, Hao; Krause, Jonathan; Satheesh, Sanjeev; Ma, Sean; Huang, Zhiheng; Karpathy, Andrej; Khosla, Aditya (1 грудня 2015). ImageNet Large Scale Visual Recognition Challenge . International Journal of Computer Vision (англ.) . Т. 115, № 3. с. 211—252. doi :10.1007/s11263-015-0816-y . ISSN 1573-1405 . Процитовано 27 травня 2022 .
↑ COCO - Common Objects in Context . cocodataset.org . Архів оригіналу за 20 жовтня 2021. Процитовано 17 жовтня 2021 .
↑ Xiao, Jianxiong, et al. «Sun database: Large-scale scene recognition from abbey to zoo.» Computer vision and pattern recognition (CVPR), 2010 IEEE conference on . IEEE, 2010.
↑ Donahue, Jeff; Jia, Yangqing; Vinyals, Oriol; Hoffman, Judy; Zhang, Ning; Tzeng, Eric; Darrell, Trevor (2013). DeCAF: A Deep Convolutional Activation Feature for Generic Visual Recognition. arXiv :1310.1531 [cs.CV ].
↑ Deng, Jia, et al. «Imagenet: A large-scale hierarchical image database .»Computer Vision and Pattern Recognition, 2009. CVPR 2009. IEEE Conference on . IEEE, 2009.
↑ а б в Krizhevsky, Alex, Ilya Sutskever, and Geoffrey E. Hinton. «Imagenet classification with deep convolutional neural networks [Архівовано 31 серпня 2019 у Wayback Machine .] .» Advances in neural information processing systems . 2012.
↑ Ivan Krasin, Tom Duerig, Neil Alldrin, Andreas Veit, Sami Abu-El-Haija, Serge Belongie, David Cai, Zheyun Feng, Vittorio Ferrari, Victor Gomes, Abhinav Gupta, Dhyanesh Narayanan, Chen Sun, Gal Chechik, Kevin Murphy. «OpenImages: A public dataset for large-scale multi-label and multi-class image classification, 2017. Available from https://github.com/openimages [Архівовано 14 квітня 2020 у Wayback Machine .] .»
↑ Vyas, Apoorv, et al. «Commercial Block Detection in Broadcast News Videos .» Proceedings of the 2014 Indian Conference on Computer Vision Graphics and Image Processing . ACM, 2014.
↑ Hauptmann, Alexander G., and Michael J. Witbrock. «Story segmentation and detection of commercials in broadcast news video .» Research and Technology Advances in Digital Libraries, 1998. ADL 98. Proceedings. IEEE International Forum on . IEEE, 1998.
↑ Tung, Anthony KH, Xin Xu, and Beng Chin Ooi. «Curler: finding and visualizing nonlinear correlation clusters [Архівовано 6 серпня 2019 у Wayback Machine .] .» Proceedings of the 2005 ACM SIGMOD international conference on Management of data . ACM, 2005.
↑ Jarrett, Kevin, et al. «What is the best multi-stage architecture for object recognition? [Архівовано 6 серпня 2019 у Wayback Machine .] .» Computer Vision, 2009 IEEE 12th International Conference on . IEEE, 2009.
↑ Lazebnik, Svetlana, Cordelia Schmid, and Jean Ponce. «Beyond bags of features: Spatial pyramid matching for recognizing natural scene categories [Архівовано 6 серпня 2019 у Wayback Machine .] .»Computer Vision and Pattern Recognition, 2006 IEEE Computer Society Conference on . Vol. 2. IEEE, 2006.
↑ Griffin, G., A. Holub, and P. Perona. Caltech-256 object category dataset California Inst . Technol., Tech. Rep. 7694, 2007 [Online]. Available: http://authors.library.caltech.edu/7694 [Архівовано 7 липня 2019 у Wayback Machine .] , 2007.
↑ Baeza-Yates, Ricardo, and Berthier Ribeiro-Neto. Modern information retrieval . Vol. 463. New York: ACM press, 1999.
↑ Fu, Xiping, et al. «NOKMeans: Non-Orthogonal K-means Hashing .» Computer Vision—ACCV 2014 . Springer International Publishing, 2014. 162—177.
↑ Heitz, Geremy; Elidan, Gal; Packer, Benjamin; Koller, Daphne (1 серпня 2009). Shape-Based Object Localization for Descriptive Classification . International Journal of Computer Vision (англ.) . Т. 84, № 1. с. 40—62. doi :10.1007/s11263-009-0228-y . ISSN 1573-1405 . Процитовано 27 травня 2022 .
↑ M. Cordts, M. Omran, S. Ramos, T. Scharwächter, M. Enzweiler, R. Benenson, U. Franke, S. Roth, and B. Schiele, «The Cityscapes Dataset [Архівовано 17 квітня 2020 у Wayback Machine .] .» In CVPR Workshop on The Future of Datasets in Vision, 2015.
↑ Everingham, Mark та ін. (2010). The pascal visual object classes (voc) challenge. International Journal of Computer Vision . 88 (2): 303—338. doi :10.1007/s11263-009-0275-4 .
↑ Felzenszwalb, Pedro F.; Girshick, Ross B.; McAllester, David; Ramanan, Deva (2010-09). Object Detection with Discriminatively Trained Part-Based Models . IEEE Transactions on Pattern Analysis and Machine Intelligence . Т. 32, № 9. с. 1627—1645. doi :10.1109/TPAMI.2009.167 . ISSN 1939-3539 . Процитовано 27 травня 2022 .
↑ а б Gong, Yunchao, and Svetlana Lazebnik. «Iterative quantization: A procrustean approach to learning binary codes.» Computer Vision and Pattern Recognition (CVPR), 2011 IEEE Conference on . IEEE, 2011.
↑ CINIC-10 dataset . Luke N. Darlow, Elliot J. Crowley, Antreas Antoniou, Amos J. Storkey (2018) CINIC-10 is not ImageNet or CIFAR-10 . 9 жовтня 2018. Архів оригіналу за 12 листопада 2018. Процитовано 13 листопада 2018 .
↑ fashion-mnist: A MNIST-like fashion product database. Benchmark :point_right , Zalando Research, 7 жовтня 2017, архів оригіналу за 20 липня 2019, процитовано 7 жовтня 2017
↑ notMNIST dataset . Machine Learning, etc . 8 вересня 2011. Архів оригіналу за 1 вересня 2019. Процитовано 13 жовтня 2017 .
↑ Houben, Sebastian, et al. «Detection of traffic signs in real-world images: The German Traffic Sign Detection Benchmark .» Neural Networks (IJCNN), The 2013 International Joint Conference on . IEEE, 2013.
↑ Mathias, Mayeul, et al. «Traffic sign recognition—How far are we from the solution? [Архівовано 30 грудня 2020 у Wayback Machine .] .» Neural Networks (IJCNN), The 2013 International Joint Conference on . IEEE, 2013.
↑ Geiger, Andreas, Philip Lenz, and Raquel Urtasun. «Are we ready for autonomous driving? the kitti vision benchmark suite [Архівовано 22 грудня 2018 у Wayback Machine .] .» Computer Vision and Pattern Recognition (CVPR), 2012 IEEE Conference on . IEEE, 2012.
↑ Sturm, Jürgen, et al. «A benchmark for the evaluation of RGB-D SLAM systems [Архівовано 12 липня 2019 у Wayback Machine .] .» Intelligent Robots and Systems (IROS), 2012 IEEE/RSJ International Conference on . IEEE, 2012.
↑ The KITTI Vision Benchmark Suite на YouTube (англ.)
↑ Chaladze, G., Kalatozishvili, L. (2017). Linnaeus 5 dataset . Chaladze.com . Retrieved 13 November 2017, from http://chaladze.com/l5/ [Архівовано 25 серпня 2019 у Wayback Machine .]
↑ Kragh, Mikkel F. та ін. (2017). FieldSAFE – Dataset for Obstacle Detection in Agriculture . Sensors . 17 (11): 2579. doi :10.3390/s17112579 . PMC 5713196 . PMID 29120383 . Архів оригіналу за 31 жовтня 2018. Процитовано 7 вересня 2019 . {{cite journal }}
: Обслуговування CS1: Сторінки із непозначеним DOI з безкоштовним доступом (посилання )
↑ Afifi, Mahmoud (12 листопада 2017). Gender recognition and biometric identification using a large dataset of hand images. arXiv :1711.04322 [cs.CV ].
↑ Lomonaco, Vincenzo; Maltoni, Davide (18 жовтня 2017). CORe50: a New Dataset and Benchmark for Continuous Object Recognition. arXiv :1705.03550 [cs.CV ].
↑ She, Qi; Feng, Fan; Hao, Xinyue; Yang, Qihan; Lan, Chuanlin; Lomonaco, Vincenzo; Shi, Xuesong; Wang, Zhengwei; Guo, Yao (6 березня 2020). OpenLORIS-Object: A Robotic Vision Dataset and Benchmark for Lifelong Deep Learning . arXiv:1911.06487 [cs, stat] . Процитовано 28 травня 2022 .
↑ Morozov, Alexei A.; Sushkova, Olga S.; Polupanov, Alexander F. (2017-06). Object-oriented logic programming of 3D intelligent video surveillance: The problem statement . 2017 IEEE 26th International Symposium on Industrial Electronics (ISIE) . IEEE. doi :10.1109/isie.2017.8001491 . Процитовано 28 травня 2022 .
↑ Morozov, Alexei; Sushkova, Olga; Kershner, Ivan; Polupanov, Alexander (2019). Development of a Method of Terahertz Intelligent Video Surveillance Based on the Semantic Fusion of Terahertz and 3D Video Images . Proceedings of the V International conference Information Technology and Nanotechnology 2019 . IP Zaitsev V.D. doi :10.18287/1613-0073-2019-2391-134-143 . Процитовано 28 травня 2022 .
↑ author., Tecuci, Gheorghe,. Knowledge engineering : building cognitive assistants for evidence-based reasoning . ISBN 978-1-107-12256-7 . OCLC 927619906 .
↑ Frey, Peter W.; Slate, David J. (1991-03). Letter recognition using Holland-style adaptive classifiers . Machine Learning . Т. 6, № 2. с. 161—182. doi :10.1007/bf00114162 . ISSN 0885-6125 . Процитовано 20 травня 2022 .
↑ Peltonen, Jaakko; Klami, Arto; Kaski, Samuel (2004-10). Improved learning of Riemannian metrics for exploratory analysis . Neural Networks (англ.) . Т. 17, № 8-9. с. 1087—1100. doi :10.1016/j.neunet.2004.06.008 . Процитовано 20 травня 2022 .
↑ а б Liu, Cheng-Lin; Yin, Fei; Wang, Da-Han; Wang, Qiu-Feng (2013-01). Online and offline handwritten Chinese character recognition: Benchmarking on new databases . Pattern Recognition (англ.) . Т. 46, № 1. с. 155—162. doi :10.1016/j.patcog.2012.06.021 . Процитовано 20 травня 2022 .
↑ Wang, Da-Han; Liu, Cheng-Lin; Yu, Jin-Lun; Zhou, Xiang-Dong (2009-07). CASIA-OLHWDB1: A Database of Online Handwritten Chinese Characters . 2009 10th International Conference on Document Analysis and Recognition . с. 1206—1210. doi :10.1109/ICDAR.2009.163 . Процитовано 20 травня 2022 .
↑ Williams, Ben H.; Toussaint, Marc; Storkey, Amos J. (2006). Extracting Motion Primitives from Natural Handwriting Data . Artificial Neural Networks – ICANN 2006. Berlin, Heidelberg: Springer Berlin Heidelberg. с. 634—643. ISBN 978-3-540-38871-5 .
↑ Calif.), IEEE/ACM International Conference on Computer-Aided Design (1998 : San Jose, (1998). 1998 IEEE/ACM International Conference on Computer-Aided Design : digest of technical papers : November 8-12, 1998, San Jose, California . IEEE Computer Society Press. ISBN 1-58113-008-2 . OCLC 40434775 .
↑ V., Cantoni, (1989). Recent issues in pattern analysis and recognition . Springer-Verlag. OCLC 555471615 .
↑ Cohen, Gregory; Afshar, Saeed; Tapson, Jonathan; van Schaik, André (17 лютого 2017). EMNIST: an extension of MNIST to handwritten letters . arXiv:1702.05373 [cs] . Процитовано 27 травня 2022 .
↑ André, Cohen, Gregory Afshar, Saeed Tapson, Jonathan van Schaik, (17 лютого 2017). EMNIST: an extension of MNIST to handwritten letters . OCLC 1106257270 .
↑ Cohen, Gregory; Afshar, Saeed; Tapson, Jonathan; van Schaik, André (17 лютого 2017). EMNIST: an extension of MNIST to handwritten letters . arXiv:1702.05373 [cs] . Процитовано 20 травня 2022 .
↑ Figure 4: Samples of handwritten isolated Arabic characters . dx.doi.org . Процитовано 20 травня 2022 .
↑ One-Shot Learning Considerations . Internet-Scale Pattern Recognition. Chapman and Hall/CRC. 20 листопада 2012. с. 53—66.
↑ Figure 10: Combination the result of feature selection and WGCNA . dx.doi.org . Процитовано 20 травня 2022 .
↑ editor, Bieger, Jordi., editor Goertzel, Ben., editor Potapov, Alexey.,. Artificial General Intelligence : 8th International Conference, AGI 2015, AGI 2015, Berlin, Germany, July 22-25, 2015, Proceedings . ISBN 3-319-21365-2 . OCLC 1113542889 .
↑ Online), International Conference on Artificial Neural Networks (European Neural Network Society) (30th : 2021 :. Artificial neural networks and machine learning -- ICANN 2021 : 30th International Conference on Artificial Neural Networks, Bratislava, Slovakia, September 14-17, 2021, Proceedings . ISBN 978-3-030-86340-1 . OCLC 1268260200 .
↑ Lecun, Y.; Bottou, L.; Bengio, Y.; Haffner, P. (Nov./1998). Gradient-based learning applied to document recognition . Proceedings of the IEEE . Т. 86, № 11. с. 2278—2324. doi :10.1109/5.726791 . Процитовано 20 травня 2022 .
↑ Kussul, Ernst; Baidyk, Tatiana (2004-10). Improved method of handwritten digit recognition tested on MNIST database . Image and Vision Computing (англ.) . Т. 22, № 12. с. 971—981. doi :10.1016/j.imavis.2004.03.008 . Процитовано 20 травня 2022 .
↑ Xu, L.; Krzyzak, A.; Suen, C.Y. (May-June/1992). Methods of combining multiple classifiers and their applications to handwriting recognition . IEEE Transactions on Systems, Man, and Cybernetics . Т. 22, № 3. с. 418—435. doi :10.1109/21.155943 . Процитовано 20 травня 2022 .
↑ Alimoglu, F.; Alpaydin, E. Combining multiple representations and classifiers for pen-based handwritten digit recognition . Proceedings of the Fourth International Conference on Document Analysis and Recognition . IEEE Comput. Soc. doi :10.1109/icdar.1997.620583 . Процитовано 20 травня 2022 .
↑ Tang, E.K.; Suganthan, P.N.; Yao, X.; Qin, A.K. (2005-04). Linear dimensionality reduction using relevance weighted LDA . Pattern Recognition (англ.) . Т. 38, № 4. с. 485—493. doi :10.1016/j.patcog.2004.09.005 . Процитовано 20 травня 2022 .
↑ Hong, Yi, et al (PDF) .
↑ Drahan, K. I. (1975). [Endocrinologic peculiarities of the course of pregnancy and labor in primaparous women of the older age groups] . Pediatriia Akusherstvo I Ginekologiia . № 5. с. 41—44. ISSN 0031-4048 . PMID 1701 . Процитовано 20 травня 2022 .
↑ Rothschild, M.; Schlein, J.; Parker, K.; Neville, C.; Sternberg, S. (30 жовтня 1975). The jumping mechanism of Xenopsylla cheopis. III. Execution of the jump and activity . Philosophical Transactions of the Royal Society of London. Series B, Biological Sciences . Т. 271, № 914. с. 499—515. doi :10.1098/rstb.1975.0064 . ISSN 0962-8436 . PMID 1806 . Процитовано 20 травня 2022 .
↑ Liu, Qun; Collier, Edward; Mukhopadhyay, Supratik (2019). Jatowt, Adam (ред.). PCGAN-CHAR: Progressively Trained Classifier Generative Adversarial Networks for Classification of Noisy Handwritten Bangla Characters . Digital Libraries at the Crossroads of Digital Information for the Future (англ.) . Springer International Publishing. с. 3—15. doi :10.1007/978-3-030-34058-2_1 . ISBN 978-3-030-34058-2 . Процитовано 27 травня 2022 .
↑ а б iSAID . captain-whu.github.io . Процитовано 27 травня 2022 .
↑ а б Butenuth, Matthias; Burkert, Florian; Schmidt, Florian; Hinz, Stefan; Hartmann, Dirk; Kneidl, Angelika; Borrmann, Andre; Sirmacek, Beril (2011-11). Integrating pedestrian simulation, tracking and event detection for crowd analysis . 2011 IEEE International Conference on Computer Vision Workshops (ICCV Workshops) . IEEE. doi :10.1109/iccvw.2011.6130237 . Процитовано 20 травня 2022 .
↑ India), CIPR (Conference) (1st : 2019 : Sibpur,. Computational intelligence in pattern recognition : proceedings of CIPR 2019 . ISBN 978-981-13-9042-5 . OCLC 1113880051 .
↑ Fradi, Hajer; Dugelay, Jean-Luc (2012-12). Low level crowd analysis using frame-wise normalized feature for people counting . 2012 IEEE International Workshop on Information Forensics and Security (WIFS) . IEEE. doi :10.1109/wifs.2012.6412657 . Процитовано 20 травня 2022 .
↑ Johnson, Brian Alan; Tateishi, Ryutaro; Hoan, Nguyen Thanh (27 червня 2013). A hybrid pansharpening approach and multiscale object-based image analysis for mapping diseased pine and oak trees . International Journal of Remote Sensing . Т. 34, № 20. с. 6969—6982. doi :10.1080/01431161.2013.810825 . ISSN 0143-1161 . Процитовано 20 травня 2022 .
↑ Mohd Pozi, Muhammad Syafiq; Sulaiman, Md Nasir; Mustapha, Norwati; Perumal, Thinagaran (3 липня 2015). A new classification model for a class imbalanced data set using genetic programming and support vector machines: case study for wilt disease classification . Remote Sensing Letters (англ.) . Т. 6, № 7. с. 568—577. doi :10.1080/2150704X.2015.1062159 . ISSN 2150-704X . Процитовано 20 травня 2022 .
↑ China), International Conference on Digital Image Processing (8th : 2016 : Chengdu,. Eighth International Conference on Digital Image Processing (ICDIP 2016) : 20-23 May 2016, Chengdu, China . ISBN 1-5106-0504-5 . OCLC 971084912 .
↑ Gallego, Antonio-Javier. MASATI dataset - MAritime SATellite Imagery dataset . www.iuii.ua.es (англ.) . Процитовано 20 травня 2022 .
↑ Gallego, Antonio-Javier; Pertusa, Antonio; Gil, Pablo (24 березня 2018). Automatic Ship Classification from Optical Aerial Images with Convolutional Neural Networks . Remote Sensing . Т. 10, № 4. с. 511. doi :10.3390/rs10040511 . ISSN 2072-4292 . Процитовано 20 травня 2022 . {{cite news }}
: Обслуговування CS1: Сторінки із непозначеним DOI з безкоштовним доступом (посилання )
↑ Chatterjee, Sankhadeep; Ghosh, Subhodeep; Dawn, Subham; Hore, Sirshendu; Dey, Nilanjan (2016). Forest Type Classification: A Hybrid NN-GA Model Based Approach . Advances in Intelligent Systems and Computing. New Delhi: Springer India. с. 227—236. ISBN 978-81-322-2756-4 .
↑ Diegert, Carl (2010-10). A combinatorial method for tracing objects using semantics of their shape . 2010 IEEE 39th Applied Imagery Pattern Recognition Workshop (AIPR) . IEEE. doi :10.1109/aipr.2010.5759716 . Процитовано 20 травня 2022 .
↑ Frédéric, Razakarivony, Sebastien Jurie,. Small Target Detection combining Foreground and Background Manifolds . OCLC 877840527 .
↑ Ilijason, Robert (2021). Getting Started with Databricks . Getting Started with Databricks. Berkeley, CA: Apress. ISBN 978-1-4842-6919-0 .
↑ Vakalopoulou, Maria; Bus, Norbert; Karantzalos, Konstantinos; Paragios, Nikos (2017-07). Integrating edge/boundary priors with classification scores for building detection in very high resolution data . 2017 IEEE International Geoscience and Remote Sensing Symposium (IGARSS) . IEEE. с. 3309—3312. doi :10.1109/IGARSS.2017.8127705 . ISBN 978-1-5090-4951-6 . Процитовано 20 травня 2022 .
↑ Vakalopoulou, Maria; Bus, Norbert; Karantzalos, Konstantinos; Paragios, Nikos (2017-07). Integrating edge/boundary priors with classification scores for building detection in very high resolution data . 2017 IEEE International Geoscience and Remote Sensing Symposium (IGARSS) . с. 3309—3312. doi :10.1109/IGARSS.2017.8127705 . Процитовано 27 травня 2022 .
↑ Yang, Yi; Newsam, Shawn (2 листопада 2010). Bag-of-visual-words and spatial extensions for land-use classification . Proceedings of the 18th SIGSPATIAL International Conference on Advances in Geographic Information Systems . Association for Computing Machinery. с. 270—279. doi :10.1145/1869790.1869829 . ISBN 978-1-4503-0428-3 . Процитовано 27 травня 2022 .
↑ а б Basu, Saikat; Ganguly, Sangram; Mukhopadhyay, Supratik; DiBiano, Robert; Karki, Manohar; Nemani, Ramakrishna (3 листопада 2015). DeepSat: a learning framework for satellite imagery . Proceedings of the 23rd SIGSPATIAL International Conference on Advances in Geographic Information Systems (англ.) . ACM. с. 1—10. doi :10.1145/2820783.2820816 . ISBN 978-1-4503-3967-4 . Процитовано 20 травня 2022 .
↑ Liu, Qun; Basu, Saikat; Ganguly, Sangram; Mukhopadhyay, Supratik; DiBiano, Robert; Karki, Manohar; Nemani, Ramakrishna (1 лютого 2020). DeepSat V2: feature augmented convolutional neural nets for satellite image classification . Remote Sensing Letters . Т. 11, № 2. с. 156—165. doi :10.1080/2150704X.2019.1693071 . ISSN 2150-704X . Процитовано 20 травня 2022 .
↑ Liu, Qun; Basu, Saikat; Ganguly, Sangram; Mukhopadhyay, Supratik; DiBiano, Robert; Karki, Manohar; Nemani, Ramakrishna (1 лютого 2020). DeepSat V2: feature augmented convolutional neural nets for satellite image classification . Remote Sensing Letters (англ.) . Т. 11, № 2. с. 156—165. doi :10.1080/2150704X.2019.1693071 . ISSN 2150-704X . Процитовано 20 травня 2022 .
↑ Harken, A. H.; Woods, M. (1976-02). The influence of oxyhemoglobin affinity on tissue oxygen consumption . Annals of Surgery . Т. 183, № 2. с. 130—135. doi :10.1097/00000658-197602000-00008 . ISSN 0003-4932 . PMC 1344074 . PMID 2111 . Процитовано 20 травня 2022 .
↑ Ebadi, Ashkan; Paul, Patrick; Auer, Sofia; Tremblay, Stéphane (19 листопада 2021), The gas meter image dataset (NRC-GAMMA) (англ.) , National Research Council of Canada, doi :10.4224/3c8s-z290 , процитовано 20 травня 2022
↑ Rabah, Chaima Ben; Coatrieux, Gouenou; Abdelfattah, Riadh (2020-10). The Supatlantique Scanned Documents Database for Digital Image Forensics Purposes . 2020 IEEE International Conference on Image Processing (ICIP) . IEEE. doi :10.1109/icip40778.2020.9190665 . Процитовано 20 травня 2022 .
↑ Mills, Kyle; Tamblyn, Isaac (12 березня 2019), Big graphene dataset (англ.) , National Research Council of Canada, doi :10.4224/c8sc04578j.data , процитовано 20 травня 2022
↑ Mills, Kyle; Spanner, Michael; Tamblyn, Isaac (18 травня 2018), Quantum simulations of an electron in a two dimensional potential well (англ.) , National Research Council of Canada, doi :10.4224/physreva.96.042113.data , процитовано 20 травня 2022
↑ Rohrbach, Marcus; Amin, Sikandar; Andriluka, Mykhaylo; Schiele, Bernt (2012-06). A database for fine grained activity detection of cooking activities . 2012 IEEE Conference on Computer Vision and Pattern Recognition . с. 1194—1201. doi :10.1109/CVPR.2012.6247801 . Процитовано 20 травня 2022 .
↑ Kuehne, Hilde; Arslan, Ali; Serre, Thomas (2014-06). The Language of Actions: Recovering the Syntax and Semantics of Goal-Directed Human Activities . 2014 IEEE Conference on Computer Vision and Pattern Recognition . IEEE. doi :10.1109/cvpr.2014.105 . Процитовано 20 травня 2022 .
↑ Sviatoslav, Voloshynovskiy, et al (PDF) .
↑ Taran, O.; Rezaeifar, S.; Dabrowski, O.; Schlechten, J.; Holotyak, T.; Voloshynovskiy, S. (2017-08). PharmaPack: Mobile fine-grained recognition of pharma packages . 2017 25th European Signal Processing Conference (EUSIPCO) . IEEE. doi :10.23919/eusipco.2017.8081543 . Процитовано 20 травня 2022 .
↑ Xiang, Li, Pu Li, Xiangyang Long, (14 червня 2020). FenceMask: A Data Augmentation Approach for Pre-extracted Image Features . OCLC 1228414137 .
↑ а б Diagnosis . Seizures in Dogs and Cats. Hoboken, NJ: John Wiley & Sons, Inc. 1 травня 2015. с. 94—128. ISBN 978-1-118-68969-1 .
↑ Biggs, Benjamin; Boyne, Oliver; Charles, James; Fitzgibbon, Andrew; Cipolla, Roberto (2020). Who Left the Dogs Out? 3D Animal Reconstruction with Expectation Maximization in the Loop . Computer Vision – ECCV 2020. Cham: Springer International Publishing. с. 195—211. ISBN 978-3-030-58620-1 .
↑ а б Stefan, Sharif Razavian, Ali Azizpour, Hossein Sullivan, Josephine Carlsson, (2014). CNN features off-the-shelf : An Astounding Baseline for Recognition . KTH, Datorseende och robotik, CVAP. OCLC 1233686320 .
↑ Ortega, M.; Rui, Y.; Chakrabarti, K.; Porkaew, K.; Mehrotra, S.; Huang, T.S. (Nov.-Dec./1998). Supporting ranked Boolean similarity queries in MARS . IEEE Transactions on Knowledge and Data Engineering . Т. 10, № 6. с. 905—925. doi :10.1109/69.738357 . Процитовано 20 травня 2022 .
↑ France), International Conference on Medical Image Computing and Computer-Assisted Intervention (15th : 2012 : Nice, (2012). Medical image computing and computer-assisted intervention--MICCAI 2012. 15th International Conference, Nice, France, October 1-5, 2012, Proceedings . Springer. ISBN 978-3-642-33418-4 . OCLC 811773023 .
↑ Deneke, Tewodors; Haile, Habtegebreil; Lafond, Sebastien; Lilius, Johan (2014-07). Video transcoding time prediction for proactive load balancing . 2014 IEEE International Conference on Multimedia and Expo (ICME) . IEEE. doi :10.1109/icme.2014.6890256 . Процитовано 20 травня 2022 .
↑ 10.3726/978-3-653-03968-9/3 . Inactive DOIs. CrossRef.
↑ Preparation H1N1, et al.: Influenza vaccination, 2010-2011 . PsycEXTRA Dataset . 2010. Процитовано 27 травня 2022 .
↑ author., Barnard, Kobus.,. Computational methods for integrating vision and language . ISBN 1-60845-113-5 . OCLC 1127139088 .
↑ Shin, Kwangsoo; Jeon, Junhyeong; Lee, Seungbin; Lim, Boyoung; Jeong, Minsoo; Nang, Jongho (2019). Approach for Video Classification with Multi-label on YouTube-8M Dataset . Lecture Notes in Computer Science. Cham: Springer International Publishing. с. 317—324. ISBN 978-3-030-11017-8 .
↑ Fisher, Justin; Kil, Hyunyoung; Lee, Dongwon (2006). OpenArXiv = arXiv + RDBMS + web services . Proceedings of the 6th ACM/IEEE-CS joint conference on Digital libraries - JCDL '06 . ACM Press. doi :10.1145/1141753.1141870 . Процитовано 20 травня 2022 .
↑ Matthieu., Deru, (2020). Deep Learning mit TensorFlow, Keras und TensorFlow.js . Rheinwerk Verlag. ISBN 978-3-8362-7427-2 . OCLC 1204141741 .
↑ Thomee, Bart; Shamma, David A.; Friedland, Gerald; Elizalde, Benjamin; Ni, Karl; Poland, Douglas; Borth, Damian; Li, Li-Jia (25 січня 2016). YFCC100M: the new data in multimedia research . Communications of the ACM (англ.) . Т. 59, № 2. с. 64—73. doi :10.1145/2812802 . ISSN 0001-0782 . Процитовано 20 травня 2022 .
↑ Baveye, Yoann; Dellandrea, Emmanuel; Chamaret, Christel; Liming Chen (1 січня 2015). LIRIS-ACCEDE: A Video Database for Affective Content Analysis . IEEE Transactions on Affective Computing . Т. 6, № 1. с. 43—55. doi :10.1109/taffc.2015.2396531 . ISSN 1949-3045 . Процитовано 20 травня 2022 .
↑ Baveye, Yoann; Dellandrea, Emmanuel; Chamaret, Christel; Chen, Liming (2015-09). Deep learning vs. kernel methods: Performance for emotion prediction in videos . 2015 International Conference on Affective Computing and Intelligent Interaction (ACII) . IEEE. doi :10.1109/acii.2015.7344554 . Процитовано 20 травня 2022 .
↑ Zhang, Xiaotong; Cheng, Xingliang; Xu, Mingxing; Zheng, Thomas Fang (2 вересня 2018). Imbalance Learning-based Framework for Fear Recognition in the MediaEval Emotional Impact of Movies Task . Interspeech 2018 . ISCA. doi :10.21437/interspeech.2018-1744 . Процитовано 20 травня 2022 .
↑ Johnson, Sam; Everingham, Mark (2010). Clustered Pose and Nonlinear Appearance Models for Human Pose Estimation . Procedings of the British Machine Vision Conference 2010 . British Machine Vision Association. doi :10.5244/c.24.12 . Процитовано 20 травня 2022 .
↑ Johnson, Sam; Everingham, Mark (2011-06). Learning effective human pose estimation from inaccurate annotation . CVPR 2011 . IEEE. doi :10.1109/cvpr.2011.5995318 . Процитовано 20 травня 2022 .
↑ Reports of six individual workshops . Nursing Mirror and Midwives Journal . Т. 142, № 2. 8 січня 1976. с. 56—59. ISSN 0143-2524 . PMID 1711 . Процитовано 20 травня 2022 .
↑ Eduard, Jauhar, Sujay Kumar Turney, Peter Hovy, (11 лютого 2016). TabMCQ: A Dataset of General Knowledge Tables and Multiple-choice Questions . OCLC 1106232721 .
↑ Taj-Eddin, Islam A.T.F.; Afifi, Mahmoud; Korashy, Mostafa; Hamdy, Doha; Nasser, Marwa; Derbaz, Shimaa (2016-07). A new compression technique for surveillance videos: Evaluation using new dataset . 2016 Sixth International Conference on Digital Information and Communication Technology and its Applications (DICTAP) . IEEE. с. 159—164. doi :10.1109/DICTAP.2016.7544020 . ISBN 978-1-4673-9609-7 . Процитовано 20 травня 2022 .
↑ Tabak, Michael A.; Norouzzadeh, Mohammad S.; Wolfson, David W.; Sweeney, Steven J.; Vercauteren, Kurt C.; Snow, Nathan P.; Halseth, Joseph M.; Di Salvo, Paul A.; Lewis, Jesse S. (2019-04). Photopoulou, Theoni (ред.). Machine learning to classify animal species in camera trap images: Applications in ecology . Methods in Ecology and Evolution (англ.) . Т. 10, № 4. с. 585—590. doi :10.1111/2041-210X.13120 . ISSN 2041-210X . Процитовано 20 травня 2022 .
↑ Taj-Eddin, Islam A. T. F. (2 листопада 2017). Can we see photosynthesis? Magnifying the tiny color changes of plant green leaves using Eulerian video magnification . Journal of Electronic Imaging . Т. 26, № 06. с. 1. doi :10.1117/1.JEI.26.6.060501 . ISSN 1017-9909 . Процитовано 20 травня 2022 .
↑ author., Danesi, Marcel, 1946-. An anthropology of puzzles : the role of puzzles in the origins and evolution of mind and culture . ISBN 978-1-350-08985-3 . OCLC 1043395986 .
↑ den, McAuley, Julian Targett, Christopher Shi, Qinfeng Hengel, Anton van (15 червня 2015). Image-based Recommendations on Styles and Substitutes . OCLC 1106220231 .
↑ author., Cantarella, Cara,. TEAS review . ISBN 978-1-260-46239-5 . OCLC 1140410786 .
↑ Ganesan, Kavita; Zhai, ChengXiang (2012-04). Opinion-based entity ranking . Information Retrieval (англ.) . Т. 15, № 2. с. 116—150. doi :10.1007/s10791-011-9174-8 . ISSN 1386-4564 . Процитовано 20 травня 2022 .
↑ China), ICSI (Conference) (4th : 2013 : Harbin,. Advances in swarm intelligence : 4th International Conference, ICSI 2013, Harbin, China, June 12-15, 2013, proceedings . ISBN 978-3-642-38702-9 . OCLC 851389904 .
↑ Harper, F. Maxwell; Konstan, Joseph A. (7 січня 2016). The MovieLens Datasets: History and Context . ACM Transactions on Interactive Intelligent Systems (англ.) . Т. 5, № 4. с. 1—19. doi :10.1145/2827872 . ISSN 2160-6455 . Процитовано 20 травня 2022 .
↑ McFee, Brian, et al .
↑ Koenigstein, Noam; Dror, Gideon; Koren, Yehuda (2011). Yahoo! music recommendations . Proceedings of the fifth ACM conference on Recommender systems - RecSys '11 . ACM Press. doi :10.1145/2043932.2043964 . Процитовано 20 травня 2022 .
↑ Dezhao., Song, (2014). Towards a linked semantic web: Precisely, comprehensively and scalably linking heterogeneous data in the semantic web . ISBN 978-1-303-66041-2 . OCLC 875517979 .
↑ Tan, Peter J.; Dowe, David L. (2002). MML Inference of Decision Graphs with Multi-way Joins . Lecture Notes in Computer Science. Berlin, Heidelberg: Springer Berlin Heidelberg. с. 131—142. ISBN 978-3-540-00197-3 .
↑ Schneebeli, Célia (23 грудня 2020). Where lol Is: Function and Position of lol Used as a Discourse Marker in YouTube Comments . Discours . № 27. doi :10.4000/discours.10900 . ISSN 1963-1723 . Процитовано 20 травня 2022 .
↑ Kim, Byung Joo (2012). Lee, Geuk; Howard, Daniel; Ślęzak, Dominik; Hong, You Sik (ред.). A Classifier for Big Data . Convergence and Hybrid Information Technology (англ.) . Т. 310. Berlin, Heidelberg: Springer Berlin Heidelberg. с. 505—512. doi :10.1007/978-3-642-32692-9_63 . ISBN 978-3-642-32691-2 .
↑ D., Pérezgonzález, Jose. Predicting Skytrax airport rankings from customer reviews . OCLC 754949191 .
↑ 1959-, Kuncheva, Ludmila I. (Ludmila Ilieva),. Combining pattern classifiers : methods and algorithms . ISBN 978-1-118-91454-0 . OCLC 878051089 .
↑ Luu-Thuy, Luu, Son T. Van Nguyen, Kiet Nguyen, Ngan (25 вересня 2020). Empirical Study of Text Augmentation on Social Media Text in Vietnamese . OCLC 1228434572 .
↑ Lim, Tjen-Sien; Loh, Wei-Yin; Shih, Yu-Shan (1 вересня 2000). A Comparison of Prediction Accuracy, Complexity, and Training Time of Thirty-Three Old and New Classification Algorithms . Machine Learning (англ.) . Т. 40, № 3. с. 203—228. doi :10.1023/A:1007608224229 . ISSN 1573-0565 . Процитовано 27 травня 2022 .
↑ editor., Gelbukh, Alexander.,. Computational Linguistics and Intelligent Text Processing 17th International Conference, CICLing 2016, Konya, Turkey, April 3-9, 2016, Revised Selected Papers, Part II . ISBN 978-3-319-75487-1 . OCLC 1205194968 .
↑ Buchanan, R. L.; Ayres, J. C. (1975-12). Effect of initial pH on aflatoxin production . Applied Microbiology . Т. 30, № 6. с. 1050—1051. doi :10.1128/am.30.6.1050-1051.1975 . ISSN 0003-6919 . PMC 376591 . PMID 2104 . Процитовано 20 травня 2022 . {{cite news }}
: Обслуговування CS1: Сторінки з PMC з іншим форматом (посилання )
↑ Dermouche, Mohamed; Velcin, Julien; Khouas, Leila; Loudcher, Sabine (2014-12). A Joint Model for Topic-Sentiment Evolution over Time . 2014 IEEE International Conference on Data Mining . IEEE. с. 773—778. doi :10.1109/ICDM.2014.82 . ISBN 978-1-4799-4302-9 . Процитовано 20 травня 2022 .
↑ Inkster, Gordon (11 червня 2014). First Catch your Corpus: Building a French Undergraduate Corpus from Readily Available Textual Resources . Teaching and Language Corpora. except Chapter 2 Corpus Evidcncc in Language Description © John M, Sindair: Routledge. с. 267—276. ISBN 978-1-315-84267-7 .
↑ Cyril, Amini, Massih R. Usunier, Nicolas Goutte, (2010). Learning from Multiple Partially Observed Views - an Application to Multilingual Text Categorization . OCLC 698457052 .
↑ Liu, Ming; et al. (2015) . Архів оригіналу за 5 листопада 2021. Процитовано 27 травня 2022 .
↑ а б Al-Harbi, S; Almuhareb, A; Al-Thubaity, A; Khorsheed, M. S.; Al-Rajeh, A (2008). "Automatic Arabic Text Classification". Proceedings of the 9th International Conference on the Statistical Analysis of Textual Data, Lyon, France.
↑ The Examiner - Spam Clickbait Catalog . www.kaggle.com (англ.) . Процитовано 20 травня 2022 .
↑ A Million News Headlines . www.kaggle.com (англ.) . Процитовано 20 травня 2022 .
↑ List of datasets for machine-learning research . Wikipedia (англ.) . 18 травня 2022. Процитовано 20 травня 2022 .
↑ Kulkarni, Rohit (11 листопада 2018), The Historical Reuters News-Wire (англ.) , Harvard Dataverse, doi :10.7910/dvn/xdb74w , процитовано 20 травня 2022
↑ Irish Times - Waxy-Wany News . www.kaggle.com (англ.) . Процитовано 20 травня 2022 .
↑ Prahal, Misra, Rishabh Arora, (20 серпня 2019). Sarcasm Detection using Hybrid Neural Network . OCLC 1228361723 .
↑ Khaled., Elleithy, (2010). Technological developments in networking, education and automation . Springer. ISBN 978-90-481-9150-5 . OCLC 646114019 .
↑ Klimt, Bryan, and Yiming Yang (PDF) .
↑ Androutsopoulos, Ion; Koutsias, John; Chandrinos, Konstantinos V.; Paliouras, George; Spyropoulos, Constantine D. (7 червня 2000). An evaluation of Naive Bayesian anti-spam filtering . arXiv:cs/0006013 . Процитовано 27 травня 2022 .
↑ Bratko, Andrej; et al. (2006). "Spam filtering using statistical data compression models" (PDF). The Journal of Machine Learning Research . 7 : 2673–2698.
↑ Almeida, Tiago A.; Hidalgo, José María G.; Yamakami, Akebo (2011). Contributions to the study of SMS spam filtering . Proceedings of the 11th ACM symposium on Document engineering - DocEng '11 . ACM Press. doi :10.1145/2034691.2034742 . Процитовано 20 травня 2022 .
↑ China), International Conference on Information Technology and Management Science (2012 : Chongqing, (2013). 2012 International Conference on Information Technology and Management Science (ICITMS 2012) proceedings . Springer. ISBN 978-3-642-34910-2 . OCLC 828409296 .
↑ Thorsten, CARNEGIE-MELLON UNIV PITTSBURGH PA DEPT OF COMPUTER SCIENCE Joachims, (1996-03). A Probabilistic Analysis of the Rocchio Algorithm with TFIDF for Text Categorization . OCLC 831635005 .
↑ editor., Cao, Jiuwen. Proceedings of ELM-2014 Volume 1 Algorithms and Theories . ISBN 978-3-319-14063-6 . OCLC 1264895874 .
↑ Dooms, Simon (6 травня 2022), MovieTweetings , процитовано 20 травня 2022
↑ RoyChowdhury, Aruni; Lin, Tsung-Yu; Maji, Subhransu; Learned-Miller, Erik (2017). "Twitter100k: A Real-world Dataset for Weakly Supervised Cross-Media Retrieval". arXiv:1703.06618 [cs.CV].
↑ Hu, Yuting; Zheng, Liang; Yang, Yi; Huang, Yongfeng (2018-04). Twitter100k: A Real-World Dataset for Weakly Supervised Cross-Media Retrieval . IEEE Transactions on Multimedia . Т. 20, № 4. с. 927—938. doi :10.1109/tmm.2017.2760101 . ISSN 1520-9210 . Процитовано 20 травня 2022 .
↑ Go, Alec; Bhayani, Richa; Huang, Lei (2009). "Twitter sentiment classification using distant supervision". CS224N Project Report, Stanford . 1 : 12.
↑ Chikersal, Prerna; Poria, Soujanya; Cambria, Erik (2015). SeNTU: Sentiment Analysis of Tweets by Combining a Rule-based Classifier with Supervised Learning . Proceedings of the 9th International Workshop on Semantic Evaluation (SemEval 2015) . Association for Computational Linguistics. doi :10.18653/v1/s15-2108 . Процитовано 20 травня 2022 .
↑ compilation., Gibson, Rachel, 1968- editor of compilation. Cantijoch, Marta, 1978- editor of compilation. Ward, Stephen, 1965- editor of (2014). Analyzing social media data and web networks . Palgrave Macmillan. ISBN 978-1-137-27677-3 . OCLC 942512517 .
↑ Zafarani, Reza, and Huan Liu. "Social computing data repository at ASU." School of Computing, Informatics and Decision Systems Engineering, Arizona State University (2009).
↑ McAuley, Julian J.; Leskovec, Jure. "Learning to Discover Social Circles in Ego Networks". NIPS . 2012 : 2012.
↑ Lovro., Šubelj,. Network-based statistical comparison of citation topology of bibliographic databases . OCLC 905091598 .
↑ Abdulla, N., et al. "Arabic sentiment analysis: Corpus-based and lexicon-based." Proceedings of the IEEE conference on Applied Electrical Engineering and Computing Technologies (AEECT) . 2013.
↑ Abooraig, Raddad; Al-Zu'bi, Shadi; Kanan, Tarek; Hawashin, Bilal; Al Ayoub, Mahmoud; Hmeidi, Ismail (2018-06). Automatic categorization of Arabic articles based on their political orientation . Digital Investigation . Т. 25. с. 24—41. doi :10.1016/j.diin.2018.04.003 . ISSN 1742-2876 . Процитовано 20 травня 2022 .
↑ Eustache, Kawala, François Douzal-Chouakria, Ahlame Gaussier, Eric Dimert,. Prédictions d'activité dans les réseaux sociaux en ligne . OCLC 862968361 .
↑ Kawala, François, et al. "Prédictions d'activité dans les réseaux sociaux en ligne." 4ième conférence sur les modèles et l'analyse des réseaux: Approches mathématiques et informatiques . 2013.
↑ Xu, Wei; Callison-Burch, Chris; Dolan, Bill (2015). SemEval-2015 Task 1: Paraphrase and Semantic Similarity in Twitter (PIT) . Proceedings of the 9th International Workshop on Semantic Evaluation (SemEval 2015) . Association for Computational Linguistics. doi :10.18653/v1/s15-2001 . Процитовано 20 травня 2022 .
↑ Xu, Wei; Ritter, Alan; Callison-Burch, Chris; Dolan, William B.; Ji, Yangfeng (2014-12). Extracting Lexically Divergent Paraphrases from Twitter . Transactions of the Association for Computational Linguistics . Т. 2. с. 435—448. doi :10.1162/tacl_a_00194 . ISSN 2307-387X . Процитовано 20 травня 2022 .
↑ Ohio), World Environmental and Water Resources Congress (2013 : Cincinnati,. World Environmental and Water Resources Congress 2013 : showcasing the future : proceedings of the 2013 congress, May 19-23, 2013, Cincinnati, Ohio . OCLC 855593586 .
↑ Southampton, University of, geoparsepy: Geoparsing library to extract and disambiguate locations from text, using OSM database for very high throughputs and no rate limits , процитовано 20 травня 2022
↑ 1908-2001., Barnouw, Erik, (2001). Media lost and found . Fordham University Press. ISBN 0-8232-2098-2 . OCLC 45015331 .
↑ Streamlit . huggingface.co . Процитовано 20 травня 2022 .
↑ "Dutch Social media collection". kaggle.com . Retrieved 18 December 2020.
↑ Adams, Paige; Anand, Pranav; Gehrke, Grant; Gera, Ralucca; Draeger, Marco; Martell, Craig; Squire, Kevin (1 вересня 2008). ReSEARCH: A Requirements Search Engine: Progress Report 2 . Процитовано 27 травня 2022 .
↑ Bill, Sordoni, Alessandro Galley, Michel Auli, Michael Brockett, Chris Ji, Yangfeng Mitchell, Margaret Nie, Jian-Yun Gao, Jianfeng Dolan, (22 червня 2015). A Neural Network Approach to Context-Sensitive Generation of Conversational Responses . OCLC 1106220776 .
↑ Westbury Lab Web Site: Reduced Redundancy USENET Corpus Download . www.psych.ualberta.ca . Процитовано 20 травня 2022 .
↑ KAN, M. (2011, January). NUS Short Message Service (SMS) Corpus. Retrieved from . Архів оригіналу за 29 червня 2018. Процитовано 27 травня 2022 . [Архівовано 2018-06-29 у Wayback Machine .]
↑ Stuck_In_the_Matrix. (2015, July 3). I have every publicly available Reddit comment for research. ~ 1.7 billion comments @ 250 GB compressed. Any interest in this? [Original post]. Message posted to .
↑ Lowe, Ryan; Pow, Nissan; Serban, Iulian; Pineau, Joelle (2015). The Ubuntu Dialogue Corpus: A Large Dataset for Research in Unstructured Multi-Turn Dialogue Systems . Proceedings of the 16th Annual Meeting of the Special Interest Group on Discourse and Dialogue . Association for Computational Linguistics. doi :10.18653/v1/w15-4640 . Процитовано 20 травня 2022 .
↑ Williams, Jason; Raux, Antoine; Henderson, Matthew (1 квітня 2016). The Dialog State Tracking Challenge Series: A Review . Dialogue & Discourse (амер.) . Процитовано 20 травня 2022 .
↑ Kowsari, Kamran; Brown, Donald E.; Heidarysafa, Mojtaba; Jafari Meimandi, Kiana; Gerber, Matthew S.; Barnes, Laura E. (2017-12). HDLTex: Hierarchical Deep Learning for Text Classification . 2017 16th IEEE International Conference on Machine Learning and Applications (ICMLA) . IEEE. с. 364—371. doi :10.1109/ICMLA.2017.0-134 . ISBN 978-1-5386-1418-1 . Процитовано 20 травня 2022 .
↑ Brown, Donald; Heidarysafa, Mojtaba; Jafari Meimandi, Kiana; Gerber, Matthew; Barnes, Laura (15 березня 2018), Web of Science Dataset , Mendeley, doi :10.17632/9rw3vkcfy4.6 , процитовано 20 травня 2022
↑ India), CICLing (Conference) (13th : 2012 : New Delhi, (2012). Computational linguistics and intelligent text processing : 13th International Conference, CICLing 2012, New Delhi, India, March 11-17, 2012, proceedings . Springer. ISBN 978-3-642-28604-9 . OCLC 798421231 .
↑ Nagwani, N K (2015-12). Summarizing large text collection using topic modeling and clustering based on MapReduce framework . Journal of Big Data (англ.) . Т. 2, № 1. с. 6. doi :10.1186/s40537-015-0020-5 . ISSN 2196-1115 . Процитовано 20 травня 2022 . {{cite news }}
: Обслуговування CS1: Сторінки із непозначеним DOI з безкоштовним доступом (посилання )
↑ Qing., Tian, (2009). Self-presentation and social interaction on blogs : a structural equation modeling of the uses and gratifications of blogging . OCLC 426169703 .
↑ Anand, Pranav, et al. "Believe Me-We Can Do This! Annotating Persuasive Acts in Blog Text."Computational Models of Natural Argument . 2011.
↑ Traud, Amanda L., Peter J. Mucha, and Mason A. Porter. "Social structure of Facebook networks." Physica A: Statistical Mechanics and its Applications 391.16 (2012): 4165–4180.
↑ Ireland, M. P. (15 грудня 1975). Distribution of lead, zinc and calcium in Dendrobaena rubida (Oligochaeta) living in soil contaminated by base metal mining in Wales . Comparative Biochemistry and Physiology. B, Comparative Biochemistry . Т. 52, № 4. с. 551—555. doi :10.1016/0305-0491(75)90236-9 . ISSN 0305-0491 . PMID 1206 . Процитовано 20 травня 2022 .
↑ Eid, Ahmad; El-Makky, Nagwa; Nagi, Khaled (2019). Towards Machine Comprehension of Arabic Text . Proceedings of the 11th International Joint Conference on Knowledge Discovery, Knowledge Engineering and Knowledge Management . SCITEPRESS - Science and Technology Publications. doi :10.5220/0008065402820288 . Процитовано 20 травня 2022 .
↑ Messina, F. S. (1975-11). Caesium ion: antagonism to chlorpromazine- and L-dopa- produced behavioural depression in mice . The Journal of Pharmacy and Pharmacology . Т. 27, № 11. с. 873—874. doi :10.1111/j.2042-7158.1975.tb10236.x . ISSN 0022-3573 . PMID 1502 . Процитовано 20 травня 2022 .
↑ Diana., Sampson, Geoffrey. McCarthy, (2005). Corpus linguistics : readings in a widening discipline . Continuum. ISBN 0-8264-8803-X . OCLC 854965241 .
↑ Collins, Michael (2003-12). Head-Driven Statistical Models for Natural Language Parsing . Computational Linguistics (англ.) . Т. 29, № 4. с. 589—637. doi :10.1162/089120103322753356 . ISSN 0891-2017 . Процитовано 20 травня 2022 .
↑ Mitwirkender, Guyon, Isabelle. Feature extraction foundations and applications . ISBN 978-3-540-35488-8 . OCLC 723990568 .
↑ Technology, Dorothy Curtis and Slav Petrov. Massachusetts Institute of Technology. Dept. of Electrical Engineering and Computer Science. Massachusetts Institute of Technology. Dept. of Electrical Engineering and Computer Science. Lin, Yuri, M. Eng. Massachusetts Institute of (1 березня 2013). Syntactically annotated Ngrams for Google Books . Massachusetts Institute of Technology. OCLC 1135080554 .
↑ Venugopalan, Subhashini; Hendricks, Lisa Anne; Mooney, Raymond; Saenko, Kate (2016). Improving LSTM-based Video Description with Linguistic Knowledge Mined from Text . Proceedings of the 2016 Conference on Empirical Methods in Natural Language Processing . Association for Computational Linguistics. doi :10.18653/v1/d16-1204 . Процитовано 20 травня 2022 .
↑ http://www.academia.edu/download/30766398/759.pdf [недоступне посилання ]
↑ Solorio, Thamar; Hasan, Ragib; Mizan, Mainul (2013-06). A Case Study of Sockpuppet Detection in Wikipedia . Proceedings of the Workshop on Language Analysis in Social Media . Association for Computational Linguistics. с. 59—68. Процитовано 27 травня 2022 .
↑ Ciarelli, Patrick Marques; Oliveira, Elias (2009). Agglomeration and Elimination of Terms for Dimensionality Reduction . 2009 Ninth International Conference on Intelligent Systems Design and Applications . IEEE. doi :10.1109/isda.2009.9 . Процитовано 20 травня 2022 .
↑ Zhou, Mingyuan, Oscar Hernan Madrid Padilla, and James G. Scott. "Priors for random count matrices derived from a family of negative binomial processes." Journal of the American Statistical Association just-accepted (2015): 00–00.
↑ Memphis), Association for Consumer Research (U.S.). Conference (35th : 2007 : (2008). Advances in consumer research . Association for Consumer Research. ISBN 978-0-915552-61-0 . OCLC 799995265 .
↑ Mclean, D. M. (1975-10). Mosquito-borne arboviruses in arctic america . Medical Biology . Т. 53, № 5. с. 264—270. ISSN 0302-2137 . PMID 1602 . Процитовано 20 травня 2022 .
↑ James., Miller, (2018). IBM Watson projects : eight exciting projects that put artificial intelligence into practice for optimal business performance . Packt. ISBN 978-1-78934-669-5 . OCLC 1056912561 .
↑ Soysal, Ömer M. (2015-04). Association rule mining with mostly associated sequential patterns . Expert Systems with Applications (англ.) . Т. 42, № 5. с. 2582—2592. doi :10.1016/j.eswa.2014.10.049 . Процитовано 20 травня 2022 .
↑ Bowman, Samuel R.; Angeli, Gabor; Potts, Christopher; Manning, Christopher D. (2015). A large annotated corpus for learning natural language inference . Proceedings of the 2015 Conference on Empirical Methods in Natural Language Processing . Association for Computational Linguistics. doi :10.18653/v1/d15-1075 . Процитовано 20 травня 2022 .
↑ Jörg., Liling, Tan. Zampieri, Marcos. Ljubešić, Nikola, 1979- Tiedemann,. Merging comparable data sources for the discrimination of similar languages the DSL corpus collection . OCLC 989161600 .
↑ Words Glossed with Definitions from Johnson’s Dictionary . Samuel Johnson. Yale University Press. 5 січня 2021. с. 815—818.
↑ Elsahar, Hady; Vougiouklis, Pavlos; Remaci, Arslen; Gravier, Christophe; Hare, Jonathon; Laforest, Frederique; Simperl, Elena (2018-05). T-REx: A Large Scale Alignment of Natural Language with Knowledge Base Triples . Proceedings of the Eleventh International Conference on Language Resources and Evaluation (LREC 2018) . European Language Resources Association (ELRA). Процитовано 20 травня 2022 .
↑ Rothschild, M.; Schlein, J. (30 жовтня 1975). The jumping mechanism of Xenopsylla cheopis. I. Exoskeletal structures and musculature . Philosophical Transactions of the Royal Society of London. Series B, Biological Sciences . Т. 271, № 914. с. 457—490. doi :10.1098/rstb.1975.0062 . ISSN 0962-8436 . PMID 1804 . Процитовано 20 травня 2022 .
↑ Llewellyn, Dawn (18 січня 2018). ‘But I Still Read The Bible!’ . Oxford Scholarship Online . doi :10.1093/oso/9780198722618.003.0032 . Процитовано 20 травня 2022 .
↑ Nangia, Nikita; Bowman, Samuel R. (2019). Human vs. Muppet: A Conservative Estimate of Human Performance on the GLUE Benchmark . Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics . Association for Computational Linguistics. doi :10.18653/v1/p19-1449 . Процитовано 20 травня 2022 .
↑ Lam, Quan Hoang; Le, Quang Duy; Nguyen, Van Kiet; Nguyen, Ngan Luu-Thuy (2020). UIT-ViIC: A Dataset for the First Evaluation on Vietnamese Image Captioning . Computational Collective Intelligence. Cham: Springer International Publishing. с. 730—742. ISBN 978-3-030-63006-5 .
↑ To, Huy Quoc; Nguyen, Kiet Van; Nguyen, Ngan Luu-Thuy; Nguyen, Anh Gia-Tuan (18 грудня 2020). Gender Prediction Based on Vietnamese Names with Machine Learning Techniques . Proceedings of the 4th International Conference on Natural Language Processing and Information Retrieval . ACM. doi :10.1145/3443279.3443309 . Процитовано 20 травня 2022 .
↑ Manning, H. L. (1975-12). New medium for isolating iron-oxidizing and heterotrophic acidophilic bacteria from acid mine drainage . Applied Microbiology . Т. 30, № 6. с. 1010—1016. doi :10.1128/am.30.6.1010-1016.1975 . ISSN 0003-6919 . PMC 376583 . PMID 2103 . Процитовано 20 травня 2022 . {{cite news }}
: Обслуговування CS1: Сторінки з PMC з іншим форматом (посилання )
↑ The Pile . pile.eleuther.ai . Процитовано 27 травня 2022 .
↑ JSON Lines . jsonlines.org . Процитовано 27 травня 2022 .
↑ Görts, C. P. (1975). Role of acetate metabolism in sporulation of Saccharomyces carlsbergensis . Antonie Van Leeuwenhoek . Т. 41, № 3. с. 265—271. doi :10.1007/BF02565062 . ISSN 0003-6072 . PMID 2101 . Процитовано 20 травня 2022 .
↑ The Pile . pile.eleuther.ai . Процитовано 20 травня 2022 .
↑ M. Versteegh, R. Thiollière, T. Schatz, X.-N. Cao, X. Anguera, A. Jansen, and E. Dupoux (2015). "The Zero Resource Speech Challenge 2015," in INTERSPEECH-2015.
↑ M. Versteegh, X. Anguera, A. Jansen, and E. Dupoux, (2016) (PDF) .
↑ Sakar, Betul Erdogdu; Isenkul, M. Erdem; Sakar, C. Okan; Sertbas, Ahmet; Gurgen, Fikret; Delil, Sakir; Apaydin, Hulya; Kursun, Olcay (2013-07). Collection and Analysis of a Parkinson Speech Dataset With Multiple Types of Sound Recordings . IEEE Journal of Biomedical and Health Informatics . Т. 17, № 4. с. 828—834. doi :10.1109/JBHI.2013.2245674 . ISSN 2168-2208 . Процитовано 26 травня 2022 .
↑ Zhao, Shunan, et al. "Automatic detection of expressed emotion in Parkinson's disease." Acoustics, Speech and Signal Processing (ICASSP), 2014 IEEE International Conference on. IEEE, 2014 (PDF) .
↑ Used in: Hammami, Nacereddine, and Mouldi Bedda. "Improved tree model for Arabic speech recognition." Computer Science and Information Technology (ICCSIT), 2010 3rd IEEE International Conference on . Vol. 5. IEEE, 2010.
↑ Maaten, Laurens (PDF) .
↑ Cole, Ronald; Fanty, Mark (1990). Spoken Letter Recognition . Speech and Natural Language: Proceedings of a Workshop Held at Hidden Valley, Pennsylvania, June 24-27,1990 . Процитовано 26 травня 2022 .
↑ Chapelle, Olivier; Sindhwani, Vikas; Keerthi, Sathiya S. (2008) (PDF) .
↑ Kudo, Mineichi; Toyama, Jun; Shimbo, Masaru (1 листопада 1999). Multidimensional curve classification using passing-through regions . Pattern Recognition Letters (англ.) . Т. 20, № 11. с. 1103—1111. doi :10.1016/S0167-8655(99)00077-X . ISSN 0167-8655 . Процитовано 26 травня 2022 .
↑ Jaeger, Herbert; Lukoševičius, Mantas; Popovici, Dan; Siewert, Udo (1 квітня 2007). Optimization and applications of echo state networks with leaky- integrator neurons . Neural Networks (англ.) . Т. 20, № 3. с. 335—352. doi :10.1016/j.neunet.2007.04.016 . ISSN 0893-6080 . Процитовано 26 травня 2022 .
↑ Tsanas, Athanasios; Little, Max A.; McSharry, Patrick E.; Ramig, Lorraine O. (2010-04). Accurate Telemonitoring of Parkinson's Disease Progression by Noninvasive Speech Tests . IEEE Transactions on Biomedical Engineering . Т. 57, № 4. с. 884—893. doi :10.1109/TBME.2009.2036000 . ISSN 1558-2531 . Процитовано 26 травня 2022 .
↑ Clifford, Gari D.; Clifton, David (18 лютого 2012). Wireless Technology in Disease Management and Medicine . Annual Review of Medicine . Т. 63, № 1. с. 479—492. doi :10.1146/annurev-med-051210-114650 . ISSN 0066-4219 . Процитовано 26 травня 2022 .
↑ Zue, Victor; Seneff, Stephanie; Glass, James (1 серпня 1990). Speech database development at MIT: Timit and beyond . Speech Communication (англ.) . Т. 9, № 4. с. 351—356. doi :10.1016/0167-6393(90)90010-7 . ISSN 0167-6393 . Процитовано 26 травня 2022 .
↑ Kapadia, Sadik, Valtcho Valtchev, and S. J. Young. "MMI training for continuous phoneme recognition on the TIMIT database." Acoustics, Speech, and Signal Processing, 1993. ICASSP-93., 1993 IEEE International Conference on . Vol. 2. IEEE, 1993.
↑ University of Southampton . Wikipedia (англ.) . 15 травня 2022. Процитовано 27 травня 2022 .
↑ Ardila, Rosana; Branson, Megan; Davis, Kelly; Henretty, Michael; Kohler, Michael; Meyer, Josh; Morais, Reuben; Saunders, Lindsay; Tyers, Francis M. (5 березня 2020). Common Voice: A Massively-Multilingual Speech Corpus . arXiv:1912.06670 [cs] . Процитовано 26 травня 2022 .
↑ The LJ Speech Dataset . keithito.com . Процитовано 26 травня 2022 .
↑ Zhou, Fang; Claire, Q.; King, Ross D. (2014-12). Predicting the Geographical Origin of Music . 2014 IEEE International Conference on Data Mining . с. 1115—1120. doi :10.1109/ICDM.2014.73 . Процитовано 26 травня 2022 .
↑ Saccenti, Edoardo; Camacho, José (2015-08). On the use of the observation-wise k -fold operation in PCA cross-validation: The k -fold operation in cross-validation . Journal of Chemometrics (англ.) . Т. 29, № 8. с. 467—478. doi :10.1002/cem.2726 . Процитовано 26 травня 2022 .
↑ Bertin-Mahieux, Thierry, et al. "The million song dataset." ISMIR 2011: Proceedings of the 12th International Society for Music Information Retrieval Conference, 24–28 October 2011, Miami, Florida . University of Miami, 2011.
↑ Chaudhuri, Sourish; Harvilla, Mark; Raj, Bhiksha (27 серпня 2011). Unsupervised learning of acoustic unit descriptors for audio content representation and classification . Interspeech 2011 . ISCA. doi :10.21437/interspeech.2011-602 . Процитовано 27 травня 2022 .
↑ Rafii, Zafar; Liutkus, Antoine; Stöter, Fabian-Robert; Mimilakis, Stylianos Ioannis; Bittner, Rachel (17 грудня 2017), MUSDB18 - a corpus for music separation , Zenodo, doi :10.5281/zenodo.1117372 , процитовано 26 травня 2022
↑ Defferrard, Michaël; Benzi, Kirell; Vandergheynst, Pierre; Bresson, Xavier (5 вересня 2017). FMA: A Dataset For Music Analysis . arXiv:1612.01840 [cs] . Процитовано 26 травня 2022 .
↑ Esposito, Roberto; Radicioni, Daniele P. (2009) (PDF) .
↑ Sourati, Jamshid; Akcakaya, Murat; Dy, Jennifer G.; Leen, Todd K.; Erdogmus, Deniz (2016-02). Classification Active Learning Based on Mutual Information . Entropy (англ.) . Т. 18, № 2. с. 51. doi :10.3390/e18020051 . ISSN 1099-4300 . Процитовано 26 травня 2022 . {{cite news }}
: Обслуговування CS1: Сторінки із непозначеним DOI з безкоштовним доступом (посилання )
↑ Salamon, Justin; Jacoby, Christopher; Bello, Juan Pablo (PDF) .
↑ Lagrange, Mathieu; Lafay, Grégoire; Rossignol, Mathias; Benetos, Emmanouil; Roebel, Axel (31 січня 2015). An evaluation framework for event detection using a morphological model of acoustic scenes . arXiv:1502.00141 [cs, stat] . Процитовано 27 травня 2022 .
↑ а б International Conference on Acoustics, Speech, and Signal Processing . Wikipedia (англ.) . 12 квітня 2021. Процитовано 27 травня 2022 .
↑ Watch out, birders: Artificial intelligence has learned to spot birds from their songs . www.science.org (англ.) . Процитовано 27 травня 2022 .
↑ Bird Audio Detection challenge . Machine Listening Lab (амер.) . 3 травня 2016. Процитовано 27 травня 2022 .
↑ Wichern, Gordon; Antognini, Joe; Flynn, Michael; Zhu, Licheng Richard; McQuinn, Emmett; Crow, Dwight; Manilow, Ethan; Roux, Jonathan Le (2 липня 2019). WHAM!: Extending Speech Separation to Noisy Environments . arXiv:1907.01160 [cs, eess, stat] . Процитовано 27 травня 2022 .
↑ Drossos, Konstantinos; Lipping, Samuel; Virtanen, Tuomas (15 жовтня 2019), Clotho dataset , Zenodo, doi :10.5281/zenodo.3490684 , процитовано 27 травня 2022
↑ UCSD Network Telescope -- Witty Worm Dataset . CAIDA (англ.) . 16 березня 2005. Процитовано 25 травня 2022 .
↑ Wayback Machine (PDF) . web.archive.org . Архів оригіналу (PDF) за 6 серпня 2019. Процитовано 27 травня 2022 . [Архівовано 2019-08-06 у Wayback Machine .]
↑ а б PhysioBank, PhysioToolkit. "PhysioNet: components of a new research resource for complex physiologic signals." Circulation. v101 i23. e215-e220 .
↑ Vergara, Alexander; Vembu, Shankar; Ayhan, Tuba; Ryan, Margaret A.; Homer, Margie L.; Huerta, Ramón (20 травня 2012). Chemical gas sensor drift compensation using classifier ensembles . Sensors and Actuators B: Chemical (англ.) . Т. 166—167. с. 320—329. doi :10.1016/j.snb.2012.01.074 . ISSN 0925-4005 . Процитовано 25 травня 2022 .
↑ Korotcenkov, G.; Cho, B. K. (31 липня 2014). Engineering approaches to improvement of conductometric gas sensor parameters. Part 2: Decrease of dissipated (consumable) power and improvement stability and reliability . Sensors and Actuators B: Chemical (англ.) . Т. 198. с. 316—341. doi :10.1016/j.snb.2014.03.069 . ISSN 0925-4005 . Процитовано 27 травня 2022 .
↑ Quinlan, John R (1992) (PDF) .
↑ Merz, Christopher J.; Pazzani, Michael J. (1 липня 1999). A Principal Components Approach to Combining Regression Estimates . Machine Learning (англ.) . Т. 36, № 1. с. 9—32. doi :10.1023/A:1007507221352 . ISSN 1573-0565 . Процитовано 27 травня 2022 .
↑ Torres-Sospedra, Joaquin; Rambla, David; Montoliu, Raul; Belmonte, Oscar; Huerta, Joaquin (2015-10). UJIIndoorLoc-Mag: A new database for magnetic field-based localization problems . 2015 International Conference on Indoor Positioning and Indoor Navigation (IPIN) . IEEE. doi :10.1109/ipin.2015.7346763 . Процитовано 27 травня 2022 .
↑ Berkvens, Rafael, Maarten Weyn, and Herbert Peremans (PDF) .
↑ Paschke, Fabian, et al. "Sensorlose Zustandsüberwachung an Synchronmotoren."Proceedings. 23. Workshop Computational Intelligence, Dortmund, 5.-6. Dezember 2013 . KIT Scientific Publishing, 2013.
↑ Lessmeier, Christian, et al (PDF) .
↑ Ugulino, Wallace, et al (PDF) . Архів оригіналу (PDF) за 25 вересня 2020. Процитовано 27 травня 2022 .
↑ Schneider, Jan; Börner, Dirk; Van Rosmalen, Peter; Specht, Marcus (2015-02). Augmenting the Senses: A Review on Sensor-Based Learning Support . Sensors (англ.) . Т. 15, № 2. с. 4097—4133. doi :10.3390/s150204097 . ISSN 1424-8220 . PMC 4367401 . PMID 25679313 . Процитовано 26 травня 2022 . {{cite news }}
: Обслуговування CS1: Сторінки з PMC з іншим форматом (посилання ) Обслуговування CS1: Сторінки із непозначеним DOI з безкоштовним доступом (посилання )
↑ Madeo, Renata CB, Clodoaldo AM Lima, and Sarajane M. Peres (PDF) .
↑ Lun, Roanna; Zhao, Wenbing (1 серпня 2015). A Survey of Applications and Human Motion Recognition with Microsoft Kinect . International Journal of Pattern Recognition and Artificial Intelligence . Т. 29, № 05. с. 1555008. doi :10.1142/S0218001415550083 . ISSN 0218-0014 . Процитовано 26 травня 2022 .
↑ Theodoridis, Theodoros, and Huosheng Hu (PDF) . Архів оригіналу (PDF) за 6 серпня 2019. Процитовано 27 травня 2022 . [Архівовано 2019-08-06 у Wayback Machine .]
↑ Etemad, Seyed Ali; Arya, Ali (2009-11). 3D human action recognition and style transformation using resilient backpropagation neural networks . 2009 IEEE International Conference on Intelligent Computing and Intelligent Systems . Т. 4. с. 296—301. doi :10.1109/ICICISYS.2009.5357690 . Процитовано 26 травня 2022 .
↑ Altun, Kerem; Barshan, Billur; Tunçel, Orkun (1 жовтня 2010). Comparative study on classifying human activities with miniature inertial and magnetic sensors . Pattern Recognition (англ.) . Т. 43, № 10. с. 3605—3620. doi :10.1016/j.patcog.2010.04.019 . ISSN 0031-3203 . Процитовано 26 травня 2022 .
↑ Nathan, Ran; Spiegel, Orr; Fortmann-Roe, Scott; Harel, Roi; Wikelski, Martin; Getz, Wayne M. (15 березня 2012). Using tri-axial acceleration data to identify behavioral modes of free-ranging animals: general concepts and tools illustrated for griffon vultures . Journal of Experimental Biology . Т. 215, № 6. с. 986—996. doi :10.1242/jeb.058602 . ISSN 0022-0949 . PMC 3284320 . PMID 22357592 . Процитовано 26 травня 2022 . {{cite news }}
: Обслуговування CS1: Сторінки з PMC з іншим форматом (посилання )
↑ Anguita, Davide, et al (PDF) .
↑ Su, Xing; Tong, Hanghang; Ji, Ping (2014-06). Activity recognition with smartphone sensors . Tsinghua Science and Technology . Т. 19, № 3. с. 235—249. doi :10.1109/TST.2014.6838194 . ISSN 1007-0214 . Процитовано 26 травня 2022 .
↑ Kadous, M. W. (2002). Temporal classification: extending the classification paradigm to multivariate time series . undefined (англ.) . Процитовано 26 травня 2022 .
↑ List of datasets for machine-learning research . Wikipedia (англ.) . 18 травня 2022. Процитовано 26 травня 2022 .
↑ Velloso, Eduardo, et al (PDF) .
↑ Mortazavi, Bobak Jack, et al (PDF) . Архів оригіналу (PDF) за 4 листопада 2021. Процитовано 27 травня 2022 . [Архівовано 2021-11-04 у Wayback Machine .]
↑ Sapsanis, Christos, et al (PDF) .
↑ а б Andrianesis, Konstantinos; Tzes, Anthony (1 травня 2015). Development and Control of a Multifunctional Prosthetic Hand with Shape Memory Alloy Actuators . Journal of Intelligent & Robotic Systems (англ.) . Т. 78, № 2. с. 257—289. doi :10.1007/s10846-014-0061-6 . ISSN 1573-0409 . Процитовано 26 травня 2022 .
↑ Banos, Oresti; Toth, Mate Attila; Damas, Miguel; Pomares, Hector; Rojas, Ignacio (2014-06). Dealing with the Effects of Sensor Displacement in Wearable Activity Recognition . Sensors (англ.) . Т. 14, № 6. с. 9995—10023. doi :10.3390/s140609995 . ISSN 1424-8220 . PMC 4118358 . PMID 24915181 . Процитовано 26 травня 2022 . {{cite news }}
: Обслуговування CS1: Сторінки з PMC з іншим форматом (посилання ) Обслуговування CS1: Сторінки із непозначеним DOI з безкоштовним доступом (посилання )
↑ Stisen, Allan, et al (PDF) .
↑ Bhattacharya, Sourav, and Nicholas D. Lane (PDF) .
↑ Bacciu, Davide; Barsocchi, Paolo; Chessa, Stefano; Gallicchio, Claudio; Micheli, Alessio (1 травня 2014). An experimental characterization of reservoir computing in ambient assisted living applications . Neural Computing and Applications (англ.) . Т. 24, № 6. с. 1451—1464. doi :10.1007/s00521-013-1364-4 . ISSN 1433-3058 . Процитовано 27 травня 2022 .
↑ Palumbo, Filippo; Barsocchi, Paolo; Gallicchio, Claudio; Chessa, Stefano; Micheli, Alessio (2013). Botía, Juan A. (ред.). Multisensor Data Fusion for Activity Recognition Based on Reservoir Computing . Evaluating AAL Systems Through Competitive Benchmarking (англ.) . Springer. с. 24—35. doi :10.1007/978-3-642-41043-7_3 . ISBN 978-3-642-41043-7 . Процитовано 27 травня 2022 .
↑ Reiss, Attila, and Didier Stricker. "Introducing a new benchmarked dataset for activity monitoring."
↑ Roggen, Daniel, et al (PDF) .
↑ Kurz, Marc, et al (PDF) .
↑ Sztyler, Timo, and Heiner Stuckenschmidt (PDF) .
↑ Zhi, Ying Xuan; Lukasik, Michelle; Li, Michael H.; Dolatabadi, Elham; Wang, Rosalie H.; Taati, Babak (2018). Automatic Detection of Compensation During Robotic Stroke Rehabilitation Therapy . IEEE Journal of Translational Engineering in Health and Medicine . Т. 6. с. 1—7. doi :10.1109/JTEHM.2017.2780836 . ISSN 2168-2372 . PMC 5788403 . PMID 29404226 . Процитовано 27 травня 2022 . {{cite news }}
: Обслуговування CS1: Сторінки з PMC з іншим форматом (посилання )
↑ Dolatabadi, Elham; Zhi, Ying Xuan; Ye, Bing; Coahran, Marge; Lupinacci, Giorgia; Mihailidis, Alex; Wang, Rosalie; Taati, Babak (23 травня 2017). The toronto rehab stroke pose dataset to detect compensation during stroke rehabilitation therapy . Proceedings of the 11th EAI International Conference on Pervasive Computing Technologies for Healthcare . Association for Computing Machinery. с. 375—381. doi :10.1145/3154862.3154925 . ISBN 978-1-4503-6363-1 . Процитовано 27 травня 2022 .
↑ Toronto Rehab Stroke Pose Dataset . www.kaggle.com (англ.) . Процитовано 27 травня 2022 .
↑ Jung, Merel M.; Poel, Mannes; Poppe, Ronald; Heylen, Dirk K. J. (1 березня 2017). Automatic recognition of touch gestures in the corpus of social touch . Journal on Multimodal User Interfaces (англ.) . Т. 11, № 1. с. 81—96. doi :10.1007/s12193-016-0232-9 . ISSN 1783-8738 . Процитовано 27 травня 2022 .
↑ Jung, M.M. (Merel) (1 June 2016) .
↑ Aeberhard, S., D. Coomans, and O. De Vel. "Comparison of classifiers in high dimensional settings." Dept. Math. Statist., James Cook Univ., North Queensland, Australia, Tech. Rep 92-02 (1992).
↑ Basu, Sugato (PDF) .
↑ Tüfekci, Pınar (1 вересня 2014). Prediction of full load electrical power output of a base load operated combined cycle power plant using machine learning methods . International Journal of Electrical Power & Energy Systems (англ.) . Т. 60. с. 126—140. doi :10.1016/j.ijepes.2014.02.027 . ISSN 0142-0615 . Процитовано 26 травня 2022 .
↑ Kaya, Heysem, Pınar Tüfekci, and Fikret S. Gürgen. "Local and global learning methods for predicting power of a combined gas & steam turbine." International conference on emerging trends in computer and electronics engineering (ICETCEE'2012), Dubai . 2012.
↑ Baldi, P.; Sadowski, P.; Whiteson, D. (2 липня 2014). Searching for exotic particles in high-energy physics with deep learning . Nature Communications (англ.) . Т. 5, № 1. с. 4308. doi :10.1038/ncomms5308 . ISSN 2041-1723 . Процитовано 26 травня 2022 .
↑ а б Baldi, Pierre; Sadowski, Peter; Whiteson, Daniel (2015). Enhanced Higgs Boson to τ+ τ− Search with Deep Learning. Physical Review Letters . 114 (11): 111801. arXiv :1410.3469 . Bibcode :2015PhRvL.114k1801B . doi :10.1103/physrevlett.114.111801 . PMID 25839260 . S2CID 2339142 .
↑ а б Adam-Bourdarios, C.; Cowan, G.; Germain-Renaud, C.; Guyon, I.; Kégl, B.; Rousseau, D. (1 грудня 2015). The Higgs Machine Learning Challenge . Т. 664. с. 072015. doi :10.1088/1742-6596/664/7/072015 . Процитовано 26 травня 2022 .
↑ Baldi, Pierre; Cranmer, Kyle; Faucett, Taylor; Sadowski, Peter; Whiteson, Daniel (2016-05). Parameterized Machine Learning for High-Energy Physics . The European Physical Journal C . Т. 76, № 5. с. 235. doi :10.1140/epjc/s10052-016-4099-4 . ISSN 1434-6044 . Процитовано 26 травня 2022 .
↑ Ortigosa, I.; Lopez, R.; Garcia, J. "A neural networks approach to residuary resistance of sailing yachts prediction". Proceedings of the International Conference on Marine Engineering MARINE . 2007 .
↑ Gerritsma, J., R. Onnink, and A. Versluis.Geometry, resistance and stability of the delft systematic yacht hull series . Delft University of Technology, 1981.
↑ Liu, Huan; Motoda, Hiroshi (31 серпня 1998). Feature Extraction, Construction and Selection: A Data Mining Perspective (англ.) . Springer Science & Business Media. ISBN 978-0-7923-8196-9 .
↑ Todorovski, Ljupčo; Džeroski, Sašo (1999). Żytkow, Jan M. (ред.). Experiments in Meta-level Learning with ILP . Principles of Data Mining and Knowledge Discovery (англ.) . Springer. с. 98—106. doi :10.1007/978-3-540-48247-5_11 . ISBN 978-3-540-48247-5 . Процитовано 26 травня 2022 .
↑ Reich, Yoram. Converging to Ideal Design Knowledge by Learning . [Carnegie Mellon University], Engineering Design Research Center, 1989.
↑ Wang, Yong (PDF) .
↑ Kibler, Dennis; Aha, David W.; Albert, Marc K. (1989-02). Instance-based prediction of real-valued attributes . Computational Intelligence (англ.) . Т. 5, № 2. с. 51—57. doi :10.1111/j.1467-8640.1989.tb00315.x . ISSN 0824-7935 . Процитовано 26 травня 2022 .
↑ Download Limit Exceeded . citeseerx.ist.psu.edu . Процитовано 26 травня 2022 .
↑ Tsanas, Athanasios; Xifara, Angeliki (1 червня 2012). Accurate quantitative estimation of energy performance of residential buildings using statistical machine learning tools . Energy and Buildings (англ.) . Т. 49. с. 560—567. doi :10.1016/j.enbuild.2012.03.003 . ISSN 0378-7788 . Процитовано 26 травня 2022 .
↑ de Wilde, Pieter (1 травня 2014). The gap between predicted and measured energy performance of buildings: A framework for investigation . Automation in Construction (англ.) . Т. 41. с. 40—49. doi :10.1016/j.autcon.2014.02.009 . ISSN 0926-5805 . Процитовано 26 травня 2022 .
↑ Brooks, Thomas F.; Pope, D. Stuart; Marcolini, Michael A. (1 липня 1989). Airfoil self-noise and prediction (PDF) (англ.) . Процитовано 26 травня 2022 .
↑ Draper, David (PDF) .
↑ Lavine, Michael (1 грудня 1991). Problems in Extrapolation Illustrated with Space Shuttle O-Ring Data . Journal of the American Statistical Association . Т. 86, № 416. с. 919—921. doi :10.1080/01621459.1991.10475132 . ISSN 0162-1459 . Процитовано 26 травня 2022 .
↑ Wang, Jun, Bei Yu, and Les Gasser (PDF) .
↑ Pettengill, Gordon H., et al .
↑ а б H.E.S.S. Collaboration; Aharonian, F.; Akhperjanian, A. G.; Barres de Almeida, U.; Bazer-Bachi, A. R.; Becherini, Y.; Behera, B.; Benbow, W.; Bernlöhr, K. (30 грудня 2008). Energy Spectrum of Cosmic-Ray Electrons at TeV Energies . Physical Review Letters . Т. 101, № 26. с. 261104. doi :10.1103/PhysRevLett.101.261104 . Процитовано 26 травня 2022 .
↑ Bock, R. K.; Chilingarian, A.; Gaug, M.; Hakl, F.; Hengstebeck, T.; Jiřina, M.; Klaschka, J.; Kotrč, E.; Savický, P. (11 січня 2004). Methods for multidimensional event classification: a case study using images from a Cherenkov gamma-ray telescope . Nuclear Instruments and Methods in Physics Research Section A: Accelerators, Spectrometers, Detectors and Associated Equipment (англ.) . Т. 516, № 2. с. 511—528. doi :10.1016/j.nima.2003.08.157 . ISSN 0168-9002 . Процитовано 26 травня 2022 .
↑ Li, Jinyan; Dong, Guozhu; Ramamohanarao, Kotagiri; Wong, Limsoon (1 лютого 2004). DeEPs: A New Instance-Based Lazy Discovery and Classification System . Machine Learning (англ.) . Т. 54, № 2. с. 99—124. doi :10.1023/B:MACH.0000011804.08528.7d . ISSN 1573-0565 . Процитовано 26 травня 2022 .
↑ Villaescusa-Navarro, Francisco; Genel, Shy; Anglés-Alcázar, Daniel; Thiele, Leander; Dave, Romeel; Narayanan, Desika; Nicola, Andrina; Li, Yin; Villanueva-Domingo, Pablo (1 квітня 2022). The CAMELS Multifield Data Set: Learning the Universe’s Fundamental Parameters with Artificial Intelligence . The Astrophysical Journal Supplement Series (англ.) . Т. 259, № 2. с. 61. doi :10.3847/1538-4365/ac5ab0 . ISSN 0067-0049 . Процитовано 26 травня 2022 . {{cite news }}
: Обслуговування CS1: Сторінки із непозначеним DOI з безкоштовним доступом (посилання )
↑ Siebert, Lee, and Tom Simkin. "Volcanoes of the world: an illustrated catalog of Holocene volcanoes and their eruptions." (2014).
↑ Sikora, M.; Wróbel, Ł (2010). Application of rule induction algorithms for analysis of data collected by seismic hazard monitoring systems in coal mines . Archives of Mining Sciences (English) . № Vol. 55, no 1. с. 91—114. ISSN 0860-7001 . Процитовано 26 травня 2022 .
↑ Sikora, Marek, and Beata Sikora. "Rough natural hazards monitoring." Rough Sets: Selected Methods and Applications in Management and Engineering . Springer London, 2012. 163–179.
↑ Addor, Nans; Newman, Andrew J.; Mizukami, Naoki; Clark, Martyn P. (20 жовтня 2017). The CAMELS data set: catchment attributes and meteorology for large-sample studies . Hydrology and Earth System Sciences (English) . Т. 21, № 10. с. 5293—5313. doi :10.5194/hess-21-5293-2017 . ISSN 1027-5606 . Процитовано 26 травня 2022 . {{cite news }}
: Обслуговування CS1: Сторінки із непозначеним DOI з безкоштовним доступом (посилання )
↑ Newman, A. J.; Clark, M. P.; Sampson, K.; Wood, A.; Hay, L. E.; Bock, A.; Viger, R. J.; Blodgett, D.; Brekke, L. (14 січня 2015). Development of a large-sample watershed-scale hydrometeorological data set for the contiguous USA: data set characteristics and assessment of regional variability in hydrologic model performance . Hydrology and Earth System Sciences (English) . Т. 19, № 1. с. 209—223. doi :10.5194/hess-19-209-2015 . ISSN 1027-5606 . Процитовано 26 травня 2022 . {{cite news }}
: Обслуговування CS1: Сторінки із непозначеним DOI з безкоштовним доступом (посилання )
↑ Alvarez-Garreton, Camila; Mendoza, Pablo A.; Boisier, Juan Pablo; Addor, Nans; Galleguillos, Mauricio; Zambrano-Bigiarini, Mauricio; Lara, Antonio; Puelma, Cristóbal; Cortes, Gonzalo (13 листопада 2018). The CAMELS-CL dataset: catchment attributes and meteorology for large sample studies – Chile dataset . Hydrology and Earth System Sciences (English) . Т. 22, № 11. с. 5817—5846. doi :10.5194/hess-22-5817-2018 . ISSN 1027-5606 . Процитовано 26 травня 2022 . {{cite news }}
: Обслуговування CS1: Сторінки із непозначеним DOI з безкоштовним доступом (посилання )
↑ Chagas, Vinícius B. P.; Chaffe, Pedro L. B.; Addor, Nans; Fan, Fernando M.; Fleischmann, Ayan S.; Paiva, Rodrigo C. D.; Siqueira, Vinícius A. (8 вересня 2020). CAMELS-BR: hydrometeorological time series and landscape attributes for 897 catchments in Brazil . Earth System Science Data (English) . Т. 12, № 3. с. 2075—2096. doi :10.5194/essd-12-2075-2020 . ISSN 1866-3508 . Процитовано 26 травня 2022 . {{cite news }}
: Обслуговування CS1: Сторінки із непозначеним DOI з безкоштовним доступом (посилання )
↑ Coxon, Gemma; Addor, Nans; Bloomfield, John P.; Freer, Jim; Fry, Matt; Hannaford, Jamie; Howden, Nicholas J. K.; Lane, Rosanna; Lewis, Melinda (12 жовтня 2020). CAMELS-GB: hydrometeorological time series and landscape attributes for 671 catchments in Great Britain . Earth System Science Data (English) . Т. 12, № 4. с. 2459—2483. doi :10.5194/essd-12-2459-2020 . ISSN 1866-3508 . Процитовано 27 травня 2022 . {{cite news }}
: Обслуговування CS1: Сторінки із непозначеним DOI з безкоштовним доступом (посилання )
↑ Fowler, Keirnan J. A.; Acharya, Suwash Chandra; Addor, Nans; Chou, Chihchung; Peel, Murray C. (6 серпня 2021). CAMELS-AUS: hydrometeorological time series and landscape attributes for 222 catchments in Australia . Earth System Science Data (English) . Т. 13, № 8. с. 3847—3867. doi :10.5194/essd-13-3847-2021 . ISSN 1866-3508 . Процитовано 26 травня 2022 . {{cite news }}
: Обслуговування CS1: Сторінки із непозначеним DOI з безкоштовним доступом (посилання )
↑ Klingler, Christoph; Schulz, Karsten; Herrnegger, Mathew (16 вересня 2021). LamaH-CE: LArge-SaMple DAta for Hydrology and Environmental Sciences for Central Europe . Earth System Science Data (English) . Т. 13, № 9. с. 4529—4565. doi :10.5194/essd-13-4529-2021 . ISSN 1866-3508 . Процитовано 26 травня 2022 . {{cite news }}
: Обслуговування CS1: Сторінки із непозначеним DOI з безкоштовним доступом (посилання )
↑ Yeh, I. -C. (1 грудня 1998). Modeling of strength of high-performance concrete using artificial neural networks . Cement and Concrete Research (англ.) . Т. 28, № 12. с. 1797—1808. doi :10.1016/S0008-8846(98)00165-3 . ISSN 0008-8846 . Процитовано 26 травня 2022 .
↑ Fazel Zarandi, M. H.; Türksen, I. B.; Sobhani, J.; Ramezanianpour, A. A. (1 січня 2008). Fuzzy polynomial neural networks for approximation of the compressive strength of concrete . Applied Soft Computing (англ.) . Т. 8, № 1. с. 488—498. doi :10.1016/j.asoc.2007.02.010 . ISSN 1568-4946 . Процитовано 26 травня 2022 .
↑ Yeh, I. "Modeling slump of concrete with fly ash and superplasticizer." Computers and Concrete 5.6 (2008): 559–572.
↑ Gencel, Osman; Kocabas, Fikret; Gok, Mustafa Sabri; Koksal, Fuat (1 серпня 2011). Comparison of artificial neural networks and general linear model approaches for the analysis of abrasive wear of concrete . Construction and Building Materials (англ.) . Т. 25, № 8. с. 3486—3494. doi :10.1016/j.conbuildmat.2011.03.040 . ISSN 0950-0618 . Процитовано 26 травня 2022 .
↑ Dietterich, Thomas G., ред. (2002). Advances in Neural Information Processing Systems 14 . doi :10.7551/mitpress/1120.001.0001 . Процитовано 27 травня 2022 .
↑ https://www.researchgate.net/profile/Massimo_Buscema/publication/13731626_MetaNet_The_Theory_of_Independent_Judges/links/0deec52baf2937fc8e000000.pdf .
↑ Photorealistic retinal images . math.unipa.it . Архів оригіналу за 29 листопада 2021. Процитовано 27 травня 2022 . [Архівовано 2021-11-29 у Wayback Machine .]
↑ Lo Castro, Dario; Tegolo, Domenico; Valenti, Cesare (1 серпня 2020). A visual framework to create photorealistic retinal vessels for diagnosis purposes . Journal of Biomedical Informatics (англ.) . Т. 108. с. 103490. doi :10.1016/j.jbi.2020.103490 . ISSN 1532-0464 . Процитовано 26 травня 2022 .
↑ Ingber, Lester (1 квітня 1997). Statistical mechanics of neocortical interactions: Canonical momenta indicatorsof electroencephalography . Physical Review E . Т. 55, № 4. с. 4578—4593. doi :10.1103/PhysRevE.55.4578 . Процитовано 26 травня 2022 .
↑ Hoffmann, Ulrich; Vesin, Jean-Marc; Ebrahimi, Touradj; Diserens, Karin (15 січня 2008). An efficient P300-based brain–computer interface for disabled subjects . Journal of Neuroscience Methods (англ.) . Т. 167, № 1. с. 115—125. doi :10.1016/j.jneumeth.2007.03.005 . ISSN 0165-0270 . Процитовано 26 травня 2022 .
↑ Donchin, E.; Spencer, K.M.; Wijesinghe, R. (2000-06). The mental prosthesis: assessing the speed of a P300-based brain-computer interface . IEEE Transactions on Rehabilitation Engineering . Т. 8, № 2. с. 174—179. doi :10.1109/86.847808 . ISSN 1558-0024 . Процитовано 26 травня 2022 .
↑ Detrano, Robert; Janosi, Andras; Steinbrunn, Walter; Pfisterer, Matthias; Schmid, Johann-Jakob; Sandhu, Sarbjit; Guppy, Kern H.; Lee, Stella; Froelicher, Victor (1 серпня 1989). International application of a new probability algorithm for the diagnosis of coronary artery disease . American Journal of Cardiology (English) . Т. 64, № 5. с. 304—310. doi :10.1016/0002-9149(89)90524-9 . ISSN 0002-9149 . PMID 2756873 . Процитовано 26 травня 2022 .
↑ Bradley, Andrew P. (1 липня 1997). The use of the area under the ROC curve in the evaluation of machine learning algorithms . Pattern Recognition (англ.) . Т. 30, № 7. с. 1145—1159. doi :10.1016/S0031-3203(96)00142-2 . ISSN 0031-3203 . Процитовано 26 травня 2022 .
↑ Street, W. Nick; Wolberg, W. H.; Mangasarian, O. L. (29 липня 1993). Nuclear feature extraction for breast tumor diagnosis . Biomedical Image Processing and Biomedical Visualization . Т. 1905. SPIE. с. 861—870. doi :10.1117/12.148698 . Процитовано 26 травня 2022 .
↑ Demir, Cigdem, and Bülent Yener .
↑ Abuse, Substance. "Mental Health Services Administration, Results from the 2010 National Survey on Drug Use and Health: Summary of National Findings, NSDUH Series H-41, HHS Publication No.(SMA) 11-4658." Rockville, MD: Substance Abuse and Mental Health Services Administration 201 (2011).
↑ Hong, Zi-Quan; Yang, Jing-Yu (1 січня 1991). Optimal discriminant plane for a small number of samples and design method of classifier on the plane . Pattern Recognition (англ.) . Т. 24, № 4. с. 317—324. doi :10.1016/0031-3203(91)90074-F . ISSN 0031-3203 . Процитовано 26 травня 2022 .
↑ а б Li, Jinyan, and Limsoon Wong. "Using rules to analyse bio-medical data: a comparison between C4. 5 and PCL." Advances in Web-Age Information Management . Springer Berlin Heidelberg, 2003. 254–265.
↑ Güvenir, H. Altay, et al (PDF) .
↑ Lagus, Krista, et al (PDF) .
↑ Strack, Beata, et al (PDF) .
↑ Rubin, Daniel J. (25 лютого 2015). Hospital Readmission of Patients with Diabetes . Current Diabetes Reports (англ.) . Т. 15, № 4. с. 17. doi :10.1007/s11892-015-0584-7 . ISSN 1539-0829 . Процитовано 27 травня 2022 .
↑ MAFFRE, Guillaume PATRY, Gervais GAUTHIER, Bruno LAY, Julien ROGER, Damien ELIE, Mélanie FOLTETE, Arthur DONJON, Hugo. Messidor . ADCIS (англ.) . Процитовано 27 травня 2022 .
↑ Haloi, Mrinal (17 липня 2016). Improved Microaneurysm Detection using Deep Neural Networks . arXiv:1505.04424 [cs] . Процитовано 27 травня 2022 .
↑ ELIE, Guillaume PATRY, Gervais GAUTHIER, Bruno LAY, Julien ROGER, Damien. "ADCIS Download Third Party: Messidor Database .
↑ Decencière, Etienne; Zhang, Xiwei; Cazuguel, Guy; Lay, Bruno; Cochener, Béatrice; Trone, Caroline; Gain, Philippe; Ordonez, Richard; Massin, Pascale (26 серпня 2014). FEEDBACK ON A PUBLICLY DISTRIBUTED IMAGE DATABASE: THE MESSIDOR DATABASE . Image Analysis & Stereology (англ.) . Т. 33, № 3. с. 231—234. doi :10.5566/ias.1155 . ISSN 1854-5165 . Процитовано 26 травня 2022 .
↑ Bagirov, A. M.; Rubinov, A. M.; Soukhoroukova, N. V.; Yearwood, J. (1 червня 2003). Unsupervised and supervised data classification via nonsmooth and global optimization . Top (англ.) . Т. 11, № 1. с. 1—75. doi :10.1007/BF02578945 . ISSN 1863-8279 . Процитовано 26 травня 2022 .
↑ Fung, Glenn, et al (PDF) .
↑ Quinlan, John Ross, et al. "Inductive knowledge acquisition: a case study." Proceedings of the Second Australian Conference on Applications of expert systems . Addison-Wesley Longman Publishing Co., Inc., 1987.
↑ а б Zhou, Zhi-Hua; Jiang, Yuan (2004-06). NeC4.5: neural ensemble based C4.5 . IEEE Transactions on Knowledge and Data Engineering . Т. 16, № 6. с. 770—773. doi :10.1109/TKDE.2004.11 . ISSN 1558-2191 . Процитовано 26 травня 2022 .
↑ Er, Orhan; Tanrikulu, Abdullah Cetin; Abakay, Abdurrahman; Temurtas, Feyzullah (1 січня 2012). An approach based on probabilistic neural network for diagnosis of Mesothelioma’s disease . Computers & Electrical Engineering (англ.) . Т. 38, № 1. с. 75—81. doi :10.1016/j.compeleceng.2011.09.001 . ISSN 0045-7906 . Процитовано 27 травня 2022 .
↑ Er, Orhan, A. Çetin Tanrikulu, and Abdurrahman Abakay .
↑ Li, Michael H.; Mestre, Tiago A.; Fox, Susan H.; Taati, Babak (6 листопада 2018). Vision-based assessment of parkinsonism and levodopa-induced dyskinesia with pose estimation . Journal of NeuroEngineering and Rehabilitation . Т. 15, № 1. с. 97. doi :10.1186/s12984-018-0446-z . ISSN 1743-0003 . PMC 6219082 . PMID 30400914 . Процитовано 27 травня 2022 . {{cite news }}
: Обслуговування CS1: Сторінки з PMC з іншим форматом (посилання ) Обслуговування CS1: Сторінки із непозначеним DOI з безкоштовним доступом (посилання )
↑ Li, Michael H.; Mestre, Tiago A.; Fox, Susan H.; Taati, Babak (2018-08). Automated assessment of levodopa-induced dyskinesia: Evaluating the responsiveness of video-based features . Parkinsonism & Related Disorders . Т. 53. с. 42—45. doi :10.1016/j.parkreldis.2018.04.036 . ISSN 1353-8020 . Процитовано 27 травня 2022 .
↑ Parkinson's Vision-Based Pose Estimation Dataset . www.kaggle.com (англ.) . Процитовано 27 травня 2022 .
↑ Shannon, Paul; Markiel, Andrew; Ozier, Owen; Baliga, Nitin S.; Wang, Jonathan T.; Ramage, Daniel; Amin, Nada; Schwikowski, Benno; Ideker, Trey (1 листопада 2003). Cytoscape: A Software Environment for Integrated Models of Biomolecular Interaction Networks . Genome Research (англ.) . Т. 13, № 11. с. 2498—2504. doi :10.1101/gr.1239303 . ISSN 1088-9051 . PMC 403769 . PMID 14597658 . Процитовано 27 травня 2022 . {{cite news }}
: Обслуговування CS1: Сторінки з PMC з іншим форматом (посилання )
↑ Javadi, Soroush; Mirroshandel, Seyed Abolghasem (1 червня 2019). A novel deep learning method for automatic assessment of human sperm images . Computers in Biology and Medicine (англ.) . Т. 109. с. 182—194. doi :10.1016/j.compbiomed.2019.04.030 . ISSN 0010-4825 . Процитовано 27 травня 2022 .
↑ Javadi, Soroush (11 січня 2022), MHSMA: The Modified Human Sperm Morphology Analysis Dataset , процитовано 27 травня 2022
↑ Clark, David, Zoltan Schreter, and Anthony Adams. "A quantitative comparison of dystal and backpropagation." Proceedings of 1996 Australian Conference on Neural Networks . 1996.
↑ Jiang, Yuan, and Zhi-Hua Zhou (PDF) .
↑ Ontañón, Santiago, and Enric Plaza. "On similarity measures based on a refinement lattice." Case-Based Reasoning Research and Development . Springer Berlin Heidelberg, 2009. 240–255.
↑ PLF data inventory , Animal-Data-Inventory, 5 листопада 2021, процитовано 27 травня 2022
↑ Higuera, Clara; Gardiner, Katheleen J.; Cios, Krzysztof J. (25 черв. 2015 р.). Self-Organizing Feature Maps Identify Proteins Critical to Learning in a Mouse Model of Down Syndrome . PLOS ONE (англ.) . Т. 10, № 6. с. e0129126. doi :10.1371/journal.pone.0129126 . ISSN 1932-6203 . PMC 4482027 . PMID 26111164 . Процитовано 27 травня 2022 . {{cite news }}
: Обслуговування CS1: Сторінки з PMC з іншим форматом (посилання ) Обслуговування CS1: Сторінки із непозначеним DOI з безкоштовним доступом (посилання )
↑ Ahmed, Md Mahiuddin; Dhanasekaran, A. Ranjitha; Block, Aaron; Tong, Suhong; Costa, Alberto C. S.; Stasko, Melissa; Gardiner, Katheleen J. (20 бер. 2015 р.). Protein Dynamics Associated with Failed and Rescued Learning in the Ts65Dn Mouse Model of Down Syndrome . PLOS ONE (англ.) . Т. 10, № 3. с. e0119491. doi :10.1371/journal.pone.0119491 . ISSN 1932-6203 . PMC 4368539 . PMID 25793384 . Процитовано 27 травня 2022 . {{cite news }}
: Обслуговування CS1: Сторінки з PMC з іншим форматом (посилання ) Обслуговування CS1: Сторінки із непозначеним DOI з безкоштовним доступом (посилання )
↑ Langley, PAT (2014) (PDF) . Архів оригіналу (PDF) за 6 серпня 2019. Процитовано 27 травня 2022 . [Архівовано 2019-08-06 у Wayback Machine .]
↑ Martin, Roman. Mushroom Data Set 2020 . mushroom.mathematik.uni-marburg.de (англ.) . Процитовано 27 травня 2022 .
↑ Wagner, Dennis; Heider, Dominik; Hattab, Georges (14 квітня 2021). Mushroom data creation, curation, and simulation to support classification tasks . Scientific Reports (англ.) . Т. 11, № 1. с. 8134. doi :10.1038/s41598-021-87602-3 . ISSN 2045-2322 . PMC 8046754 . PMID 33854157 . Процитовано 27 травня 2022 . {{cite news }}
: Обслуговування CS1: Сторінки з PMC з іншим форматом (посилання )
↑ Alberg, Dima (17 грудня 2015). An Interval Tree Approach to Predict Forest Fires using Meteorological Data . International Journal of Computer Applications . Т. 132, № 4. с. 17—22. doi :10.5120/ijca2015907398 . ISSN 0975-8887 . Процитовано 27 травня 2022 .
↑ Farquad, M. A. H.; Ravi, V.; Raju, S. Bapi (1 серпня 2010). Support vector regression based hybrid rule extraction methods for forecasting . Expert Systems with Applications (англ.) . Т. 37, № 8. с. 5577—5589. doi :10.1016/j.eswa.2010.02.055 . ISSN 0957-4174 . Процитовано 26 травня 2022 .
↑ Fisher, R. A. (1936-09). THE USE OF MULTIPLE MEASUREMENTS IN TAXONOMIC PROBLEMS . Annals of Eugenics (англ.) . Т. 7, № 2. с. 179—188. doi :10.1111/j.1469-1809.1936.tb02137.x . Процитовано 26 травня 2022 .
↑ Ghahramani, Zoubin, and Michael I. Jordan (PDF) . Архів оригіналу (PDF) за 22 квітня 2017. Процитовано 27 травня 2022 . [Архівовано 2017-04-22 у Wayback Machine .]
↑ Mallah, Charles; Cope, James; Orwell, James (2013) .
↑ Yahiaoui, Itheri, Olfa Mzoughi, and Nozha Boujemaa (PDF) . Архів оригіналу (PDF) за 6 серпня 2019. Процитовано 27 травня 2022 . [Архівовано 2019-08-06 у Wayback Machine .]
↑ Tan, MING; Eshelman, LARRY (1 січня 1988). Laird, John (ред.). Using Weighted Networks to Represent Classification Knowledge in Noisy Domains . Machine Learning Proceedings 1988 (англ.) . San Francisco (CA): Morgan Kaufmann. с. 121—134. ISBN 978-0-934613-64-4 .
↑ Charytanowicz, Małgorzata, et al (PDF) .
↑ Sanchez, Mauricio A.; Castillo, Oscar; Castro, Juan R.; Melin, Patricia (20 вересня 2014). Fuzzy granular gravitational clustering algorithm for multivariate data . Information Sciences (англ.) . Т. 279. с. 498—511. doi :10.1016/j.ins.2014.04.005 . ISSN 0020-0255 . Процитовано 27 травня 2022 .
↑ Blackard, Jock A.; Dean, Denis J. (1 грудня 1999). Comparative accuracies of artificial neural networks and discriminant analysis in predicting forest cover types from cartographic variables . Computers and Electronics in Agriculture (англ.) . Т. 24, № 3. с. 131—151. doi :10.1016/S0168-1699(99)00046-0 . ISSN 0168-1699 . Процитовано 26 травня 2022 .
↑ Fürnkranz, Johannes (2001). Round Robin Rule Learning . Proceedings of the 18th International Conference on Machine Learning (ICML-01):146– 153 . Morgan Kaufmann. с. 146—153. Процитовано 26 травня 2022 .
↑ Li, Song; Assmann, Sarah M.; Albert, Réka (12 вер. 2006 р.). Predicting Essential Components of Signal Transduction Networks: A Dynamic Model of Guard Cell Abscisic Acid Signaling . PLOS Biology (англ.) . Т. 4, № 10. с. e312. doi :10.1371/journal.pbio.0040312 . ISSN 1545-7885 . PMC 1564158 . PMID 16968132 . Процитовано 26 травня 2022 . {{cite news }}
: Обслуговування CS1: Сторінки з PMC з іншим форматом (посилання ) Обслуговування CS1: Сторінки із непозначеним DOI з безкоштовним доступом (посилання )
↑ Munisami, Trishen; Ramsurn, Mahess; Kishnah, Somveer; Pudaruth, Sameerchand (1 січня 2015). Plant Leaf Recognition Using Shape Features and Colour Histogram with K-nearest Neighbour Classifiers . Procedia Computer Science (англ.) . Т. 58. с. 740—747. doi :10.1016/j.procs.2015.08.095 . ISSN 1877-0509 . Процитовано 26 травня 2022 .
↑ Li, Bai (1 березня 2016). Atomic potential matching: An evolutionary target recognition approach based on edge features . Optik (англ.) . Т. 127, № 5. с. 3162—3168. doi :10.1016/j.ijleo.2015.11.186 . ISSN 0030-4026 . Процитовано 26 травня 2022 .
↑ Nilsback, Maria-Elena, and Andrew Zisserman (PDF) .
↑ Giselsson, Thomas Mosgaard; Jørgensen, Rasmus Nyholm; Jensen, Peter Kryger; Dyrmann, Mads; Midtiby, Henrik Skov (15 листопада 2017). A Public Image Database for Benchmark of Plant Seedling Classification Algorithms . arXiv:1711.05458 [cs] . Процитовано 26 травня 2022 .
↑ Mureşan, Horea; Oltean, Mihai (1 серпня 2018). Fruit recognition from images using deep learning . Acta Universitatis Sapientiae, Informatica (англ.) . Т. 10, № 1. с. 26—42. doi :10.2478/ausi-2018-0002 . Процитовано 26 травня 2022 .
↑ Fruits 360 . www.kaggle.com (англ.) . Процитовано 26 травня 2022 .
↑ Nakai, Kenta; Kanehisa, Minoru (1991-10). Expert system for predicting protein localization sites in gram-negative bacteria . Proteins: Structure, Function, and Genetics (англ.) . Т. 11, № 2. с. 95—110. doi :10.1002/prot.340110203 . ISSN 0887-3585 . Процитовано 26 травня 2022 .
↑ Ling, Charles X., et al (PDF) .
↑ Validate User . academic.oup.com . Процитовано 27 травня 2022 .
↑ Validate User . academic.oup.com . Процитовано 26 травня 2022 .
↑ Allwein, Erin L.; Schapire, Robert E.; Singer, Yoram (2001) .
↑ Allwein, Erin L.; Schapire, Robert E.; Singer, Yoram (2001) (PDF) .
↑ Mayr, Andreas; Klambauer, Günter; Unterthiner, Thomas; Hochreiter, Sepp (2016). DeepTox: Toxicity Prediction using Deep Learning . Frontiers in Environmental Science . Т. 3. doi :10.3389/fenvs.2015.00080 . ISSN 2296-665X . Процитовано 27 травня 2022 . {{cite news }}
: Обслуговування CS1: Сторінки із непозначеним DOI з безкоштовним доступом (посилання )
↑ Lavin, Alexander; Ahmad, Subutai (2015-12). Evaluating Real-Time Anomaly Detection Algorithms – The Numenta Anomaly Benchmark . 2015 IEEE 14th International Conference on Machine Learning and Applications (ICMLA) . с. 38—44. doi :10.1109/ICMLA.2015.141 . Процитовано 27 травня 2022 .
↑ team, Waico (25 травня 2022), About SKAB , процитовано 27 травня 2022
↑ Skoltech Anomaly Benchmark (SKAB) . www.kaggle.com (англ.) . doi :10.34740/kaggle/dsv/1693952 . Процитовано 27 травня 2022 .
↑ Campos, Guilherme O.; Zimek, Arthur; Sander, Jörg; Campello, Ricardo J. G. B.; Micenková, Barbora; Schubert, Erich; Assent, Ira; Houle, Michael E. (1 липня 2016). On the evaluation of unsupervised outlier detection: measures, datasets, and an empirical study . Data Mining and Knowledge Discovery (англ.) . Т. 30, № 4. с. 891—927. doi :10.1007/s10618-015-0444-8 . ISSN 1573-756X . Процитовано 27 травня 2022 .
↑ Ann-Kathrin Hartmann, Tommaso Soru, Edgard Marx .
↑ Soru, Tommaso; Marx, Edgard; Moussallem, Diego; Publio, Gustavo; Valdestilhas, André; Esteves, Diego; Neto, Ciro Baron (5 травня 2020). SPARQL as a Foreign Language . arXiv:1708.07624 [cs] . Процитовано 27 травня 2022 .
↑ Kiet Van Nguyen, Duc-Vu Nguyen, Anh Gia-Tuan Nguyen, Ngan Luu-Thuy Nguyen (PDF) .
↑ Nguyen, Kiet Van; Tran, Khiem Vinh; Luu, Son T.; Nguyen, Anh Gia-Tuan; Nguyen, Ngan Luu-Thuy (2020). Enhancing Lexical-Based Approach With External Knowledge for Vietnamese Multiple-Choice Machine Reading Comprehension . IEEE Access . Т. 8. с. 201404—201417. doi :10.1109/ACCESS.2020.3035701 . ISSN 2169-3536 . Процитовано 27 травня 2022 .
↑ Brown, Michael Scott, Michael J. Pelosi, and Henry Dirska (PDF) .{{cite news }}
: Обслуговування CS1: Сторінки з параметром url-status, але без параметра archive-url (посилання )
↑ Shen, Kao-Yi; Tzeng, Gwo-Hshiung (1 вересня 2015). Fuzzy Inference-Enhanced VC-DRSA Model for Technical Analysis: Investment Decision Aid . International Journal of Fuzzy Systems (англ.) . Т. 17, № 3. с. 375—389. doi :10.1007/s40815-015-0058-8 . ISSN 2199-3211 . Процитовано 26 травня 2022 .
↑ Quinlan, J. R. (1 вересня 1987). Simplifying decision trees . International Journal of Man-Machine Studies (англ.) . Т. 27, № 3. с. 221—234. doi :10.1016/S0020-7373(87)80053-6 . ISSN 0020-7373 . Процитовано 26 травня 2022 .
↑ Hamers, Bart; Suykens, Johan AK; De Moor, Bart (2003) (PDF) .
↑ Shmueli, Galit; Russo, Ralph P.; Jank, Wolfgang (1 грудня 2007). The BARISTA: A model for bid arrivals in online auctions . The Annals of Applied Statistics . Т. 1, № 2. doi :10.1214/07-AOAS117 . ISSN 1932-6157 . Процитовано 26 травня 2022 .
↑ Peng, Jie; Müller, Hans-Georg (1 вересня 2008). Distance-based clustering of sparsely observed stochastic processes, with applications to online auctions . The Annals of Applied Statistics . Т. 2, № 3. doi :10.1214/08-AOAS172 . ISSN 1932-6157 . Процитовано 26 травня 2022 .
↑ а б в г д Download Limit Exceeded . citeseerx.ist.psu.edu . Процитовано 27 травня 2022 .
↑ Moro, Sérgio; Cortez, Paulo; Rita, Paulo (1 червня 2014). A data-driven approach to predict the success of bank telemarketing . Decision Support Systems (англ.) . Т. 62. с. 22—31. doi :10.1016/j.dss.2014.03.001 . ISSN 0167-9236 . Процитовано 26 травня 2022 .
↑ Payne, Richard D.; Mallick, Bani K. (20 березня 2017). Two-Stage Metropolis-Hastings for Tall Data . arXiv:1411.5653 [stat] . Процитовано 26 травня 2022 .
↑ Akbilgic, Oguz; Bozdogan, Hamparsum; Balaban, M. Erdal (1 травня 2014). A novel Hybrid RBF Neural Networks model as a forecaster . Statistics and Computing (англ.) . Т. 24, № 3. с. 365—375. doi :10.1007/s11222-013-9375-7 . ISSN 1573-1375 . Процитовано 26 травня 2022 .
↑ Yeh, I-Cheng; Lien, Che-hui (1 березня 2009). The comparisons of data mining techniques for the predictive accuracy of probability of default of credit card clients . Expert Systems with Applications (англ.) . Т. 36, № 2, Part 1. с. 2473—2480. doi :10.1016/j.eswa.2007.12.020 . ISSN 0957-4174 . Процитовано 26 травня 2022 .
↑ Lin, Shu Ling (1 травня 2009). A new two-stage hybrid approach of credit risk in banking industry . Expert Systems with Applications (англ.) . Т. 36, № 4. с. 8333—8341. doi :10.1016/j.eswa.2008.10.015 . ISSN 0957-4174 . Процитовано 26 травня 2022 .
↑ Pelckmans, Kristiaan; De Brabanter, Jos; Suykens, Johan A. K.; De Moor, Bart (1 грудня 2005). The differogram: Non-parametric noise variance estimation and its use for model selection . Neurocomputing (англ.) . Т. 69, № 1. с. 100—122. doi :10.1016/j.neucom.2005.02.015 . ISSN 0925-2312 . Процитовано 26 травня 2022 .
↑ Bay, Stephen D.; Kibler, Dennis; Pazzani, Michael J.; Smyth, Padhraic (1 грудня 2000). The UCI KDD archive of large data sets for data mining research and experimentation . ACM SIGKDD Explorations Newsletter . Т. 2, № 2. с. 81—85. doi :10.1145/380995.381030 . ISSN 1931-0145 . Процитовано 26 травня 2022 .
↑ Lucas, D. D.; Yver Kwok, C.; Cameron-Smith, P.; Graven, H.; Bergmann, D.; Guilderson, T. P.; Weiss, R.; Keeling, R. (16 червня 2015). Designing optimal greenhouse gas observing networks that consider performance and cost . Geoscientific Instrumentation, Methods and Data Systems (English) . Т. 4, № 1. с. 121—137. doi :10.5194/gi-4-121-2015 . ISSN 2193-0856 . Процитовано 26 травня 2022 . {{cite news }}
: Обслуговування CS1: Сторінки із непозначеним DOI з безкоштовним доступом (посилання )
↑ Pales, Jack C.; Keeling, Charles D. (15 грудня 1965). The concentration of atmospheric carbon dioxide in Hawaii . Journal of Geophysical Research (англ.) . Т. 70, № 24. с. 6053—6076. doi :10.1029/JZ070i024p06053 . Процитовано 26 травня 2022 .
↑ Sigillito, Vincent G., et al. "Classification of radar returns from the ionosphere using neural networks." Johns Hopkins APL Technical Digest 10.3 (1989): 262–266.
↑ Reich, Brian J., Montserrat Fuentes, and David B. Dunson .
↑ Kohavi, Ron (1996). "Scaling Up the Accuracy of Naive-Bayes Classifiers: A Decision-Tree Hybrid". KDD . 96 .
↑ Oza, Nikunj C., and Stuart Russell. "Experimental comparisons of online and batch versions of bagging and boosting." Proceedings of the seventh ACM SIGKDD international conference on Knowledge discovery and data mining . ACM, 2001.
↑ Bay, Stephen D. (1 листопада 2001). Multivariate Discretization for Set Mining . Knowledge and Information Systems (англ.) . Т. 3, № 4. с. 491—512. doi :10.1007/PL00011680 . ISSN 0219-1377 . Процитовано 26 травня 2022 .
↑ Ruggles, Steven (1 січня 1995). Sample Designs and Sampling Errors . Historical Methods: A Journal of Quantitative and Interdisciplinary History . Т. 28, № 1. с. 40—46. doi :10.1080/01615440.1995.9955312 . ISSN 0161-5440 . Процитовано 26 травня 2022 .
↑ Meek, Christopher, Bo Thiesson, and David Heckerman (PDF) .
↑ Fanaee-T, Hadi; Gama, Joao (1 червня 2014). Event labeling combining ensemble detectors and background knowledge . Progress in Artificial Intelligence (англ.) . Т. 2, № 2. с. 113—127. doi :10.1007/s13748-013-0040-3 . ISSN 2192-6360 . Процитовано 27 травня 2022 .
↑ Giot, Romain, and Raphaël Cherrier (PDF) .
↑ Zhan, Xianyuan; Hasan, Samiul; Ukkusuri, Satish V.; Kamga, Camille (1 серпня 2013). Urban link travel time estimation using large-scale taxi data with partial information . Transportation Research Part C: Emerging Technologies (англ.) . Т. 33. с. 37—49. doi :10.1016/j.trc.2013.04.001 . ISSN 0968-090X . Процитовано 27 травня 2022 .
↑ Moreira-Matias, Luis; Gama, João; Ferreira, Michel; Mendes-Moreira, João; Damas, Luis (2013-09). Predicting Taxi–Passenger Demand Using Streaming Data . IEEE Transactions on Intelligent Transportation Systems . Т. 14, № 3. с. 1393—1402. doi :10.1109/TITS.2013.2262376 . ISSN 1558-0016 . Процитовано 27 травня 2022 .
↑ Hwang, Ren-Hung; Hsueh, Yu-Ling; Chen, Yu-Ting (1 вересня 2015). An effective taxi recommender system based on a spatio-temporal factor analysis model . Information Sciences (англ.) . Т. 314. с. 28—40. doi :10.1016/j.ins.2015.03.068 . ISSN 0020-0255 . Процитовано 27 травня 2022 .
↑ H. V. Jagadish, Johannes Gehrke, Alexandros Labrinidis, Yannis Papakonstantinou, Jignesh M. Patel, Raghu Ramakrishnan, and Cyrus Shahabi. Big data and its technical challenges. Commun. ACM, 57(7):86–94, July 2014.
↑ Caltrans PeMS . pems.dot.ca.gov . Процитовано 27 травня 2022 .
↑ Meusel, Robert, et al .
↑ Fradkin, Dmitriy, and David Madigan (PDF) .
↑ This data was used in the American Statistical Association Statistical Graphics and Computing Sections 1999 Data Exposition.
↑ Ma, Justin, et al (PDF) .
↑ Levchenko, Kirill, et al (PDF) .
↑ Mohammad, Rami M., Fadi Thabtah, and Lee McCluskey (PDF) .
↑ Singh, Ashishkumar, et al .
↑ Mintz, Mike; Bills, Steven; Snow, Rion; Jurafsky, Daniel (2009-08). Distant supervision for relation extraction without labeled data . Proceedings of the Joint Conference of the 47th Annual Meeting of the ACL and the 4th International Joint Conference on Natural Language Processing of the AFNLP . Association for Computational Linguistics. с. 1003—1011. Процитовано 27 травня 2022 .
↑ Mesterharm, Chris, and Michael J. Pazzani (PDF) . Архів оригіналу (PDF) за 22 вересня 2017. Процитовано 27 травня 2022 . [Архівовано 2017-09-22 у Wayback Machine .]
↑ Wang, Shusen; Zhang, Zhihua (1 березня 2013). Improving CUR Matrix Decomposition and the Nyström Approximation via Adaptive Sampling . Процитовано 26 травня 2022 .
↑ Cattral, R.; Oppacher, F.; Deugo, D. (2001). Evolutionary Data Mining With Automatic Rule Generalization . www.semanticscholar.org (англ.) . Процитовано 26 травня 2022 .
↑ Future generations computer systems FGCS (English) . Amsterdam: North-Holland. 1995. OCLC 936514947 .
↑ Bain, Michael; Muggleton, Stephen (1994). "Learning optimal chess strategies". Machine Intelligence . Oxford University Press, Inc. 13 .
↑ а б Quinlan, J. Ross (1983). Michalski, Ryszard S.; Carbonell, Jaime G.; Mitchell, Tom M. (ред.). Learning Efficient Classification Procedures and Their Application to Chess End Games . Machine Learning: An Artificial Intelligence Approach (англ.) . Berlin, Heidelberg: Springer. с. 463—482. doi :10.1007/978-3-662-12405-5_15 . ISBN 978-3-662-12405-5 .
↑ Matheus, Christopher J.; Rendell, Larry A. (1989) (PDF) .{{cite news }}
: Обслуговування CS1: Сторінки з параметром url-status, але без параметра archive-url (посилання )
↑ Belsley, David A., Edwin Kuh, and Roy E. Welsch. Regression diagnostics: Identifying influential data and sources of collinearity . Vol. 571. John Wiley & Sons, 2005.
↑ Ruotsalo, Tuukka; Aroyo, Lora; Schreiber, G. (2009). Knowledge-Based Linguistic Annotation of Digital Cultural Heritage Collections . IEEE Intelligent Systems . doi :10.1109/MIS.2009.32 . Процитовано 26 травня 2022 .
↑ Li, Lihong; Chu, Wei; Langford, John; Wang, Xuanhui (2011). Unbiased Offline Evaluation of Contextual-bandit-based News Article Recommendation Algorithms . Proceedings of the fourth ACM international conference on Web search and data mining - WSDM '11 . с. 297. doi :10.1145/1935826.1935878 . Процитовано 26 травня 2022 .
↑ Yeung, Kam Fung; Yang, Yanyan (2010-09). A Proactive Personalized Mobile News Recommendation System . 2010 Developments in E-systems Engineering . с. 207—212. doi :10.1109/DeSE.2010.40 . Процитовано 26 травня 2022 .
↑ Gass, Susan E.; Roberts, J. Murray (1 травня 2006). The occurrence of the cold-water coral Lophelia pertusa (Scleractinia) on oil and gas platforms in the North Sea: Colony growth, recruitment and environmental controls on distribution . Marine Pollution Bulletin (англ.) . Т. 52, № 5. с. 549—559. doi :10.1016/j.marpolbul.2005.10.002 . ISSN 0025-326X . Процитовано 26 травня 2022 .
↑ Gionis, Aristides; Mannila, Heikki; Tsaparas, Panayiotis. Clustering aggregation . in ICDE 2005, 2005 . с. 341—352. Процитовано 26 травня 2022 .
↑ Vucetic, Slobodan; Obradovic, Zoran (2001). Classification on Data with Biased Class Distribution . Machine Learning: ECML 2001. Berlin, Heidelberg: Springer Berlin Heidelberg. с. 527—538. ISBN 978-3-540-42536-6 .
↑ van der Putten, Peter; van Someren, Maarten (2004-10). A Bias-Variance Analysis of a Real World Learning Problem: The CoIL Challenge 2000 . Machine Learning . Т. 57, № 1/2. с. 177—195. doi :10.1023/b:mach.0000035476.95130.99 . ISSN 0885-6125 . Процитовано 27 травня 2022 .
↑ Mao, K.Z. (2002-09). RBF neural network center selection based on Fisher ratio class separability measure . IEEE Transactions on Neural Networks . Т. 13, № 5. с. 1211—1217. doi :10.1109/TNN.2002.1031953 . ISSN 1941-0093 . Процитовано 26 травня 2022 .
↑ Bohanec, Marko; Cestnik, Bojan; Rajkoviè, Vladislav (2001-01). Qualitative Multi-attribute Modeling and its Application in Housing . Journal of Decision Systems . Т. 10, № 2. с. 175—193. doi :10.3166/jds.10.175-193 . ISSN 1246-0125 . Процитовано 27 травня 2022 .
↑ Madani, Omid; Lizotte, Daniel J.; Greiner, Russell (2004). The Budgeted Multi-armed Bandit Problem . Learning Theory. Berlin, Heidelberg: Springer Berlin Heidelberg. с. 643—645. ISBN 978-3-540-22282-8 .
↑ Anderson, John R.; Michalski, Ryszard S.; Carbonell, Jaime G.; Mitchell, Tom M. (1983). Machine learning : an artificial intelligence approach . Palo Alto, Calif.: Tioga Pub. Co. ISBN 0-935382-05-4 . OCLC 9262069 .
↑ Yeh, I-Cheng; Yang, King-Jang; Ting, Tao-Ming (2009-04). Knowledge discovery on RFM model using Bernoulli sequence . Expert Systems with Applications (англ.) . Т. 36, № 3. с. 5866—5871. doi :10.1016/j.eswa.2008.07.018 . Процитовано 27 травня 2022 .
↑ Lee, Wen-Chen; Ma, Mi-Chia; Cheng, Bor-Wen (1 грудня 2009). Field Comparison of Driving Performance Using a Portable Navigation System . Journal of Navigation . Т. 63, № 1. с. 39—50. doi :10.1017/s0373463309990221 . ISSN 0373-4633 . Процитовано 27 травня 2022 .
↑ Brenner, Hermann; Schmidtmann, Irene; Stegmaier, Christa (15 грудня 1997). <2633::aid-sim702>3.0.co;2-1 Effects of record linkage errors on registry-based follow-up studies . Statistics in Medicine . Т. 16, № 23. с. 2633—2643. doi :10.1002/(sici)1097-0258(19971215)16:23<2633::aid-sim702>3.0.co;2-1 . ISSN 0277-6715 . Процитовано 27 травня 2022 .
↑ Sariyar, Murat; Borg, Andreas; Pommerening, Klaus (1 серпня 2011). Controlling false match rates in record linkage using extreme value theory . Journal of Biomedical Informatics (англ.) . Т. 44, № 4. с. 648—654. doi :10.1016/j.jbi.2011.02.008 . ISSN 1532-0464 . Процитовано 27 травня 2022 .
↑ Candillier, Laurent; Lemaire, Vincent (2013-08). Active learning in the real-world design and analysis of the Nomao challenge . The 2013 International Joint Conference on Neural Networks (IJCNN) . IEEE. doi :10.1109/ijcnn.2013.6706908 . Процитовано 27 травня 2022 .
↑ Yu, Ning (30 березня 2013). Domain Adaptation for Opinion Classification: A Self-Training Approach . Journal of Information Science Theory and Practice . Т. 1, № 1. с. 10—26. doi :10.1633/jistap.2013.1.1.1 . ISSN 2287-9099 . Процитовано 27 травня 2022 .
↑ Nagesh, Harsha; Goil, Sanjay; Choudhary, Alok (5 квітня 2001). Adaptive Grids for Clustering Massive Data Sets . Proceedings of the 2001 SIAM International Conference on Data Mining . Society for Industrial and Applied Mathematics. doi :10.1137/1.9781611972719.7 . Процитовано 27 травня 2022 .
↑ Kuzilek, Jakub; Hlosta, Martin; Zdrahal, Zdenek (28 листопада 2017). Open University Learning Analytics dataset . Scientific Data . Т. 4, № 1. doi :10.1038/sdata.2017.171 . ISSN 2052-4463 . Процитовано 28 травня 2022 .
↑ Siemens, George (3 липня 2019). Learning analytics and open, flexible, and distance learning . Distance Education . Т. 40, № 3. с. 414—418. doi :10.1080/01587919.2019.1656153 . ISSN 0158-7919 . Процитовано 28 травня 2022 .
↑ Barlacchi, Gianni; De Nadai, Marco; Larcher, Roberto; Casella, Antonio; Chitic, Cristiana; Torrisi, Giovanni; Antonelli, Fabrizio; Vespignani, Alessandro; Pentland, Alex (2015). A multi-source dataset of urban life in the city of Milan and the Province of Trentino . Scientific Data . Т. 2. с. 150055. doi :10.1038/sdata.2015.55 . ISSN 2052-4463 . PMC 4622222 . PMID 26528394 . Процитовано 24 травня 2022 .
↑ Vanschoren, Joaquin; van Rijn, Jan N.; Bischl, Bernd; Torgo, Luis (16 червня 2014). OpenML: networked science in machine learning . ACM SIGKDD Explorations Newsletter . Т. 15, № 2. с. 49—60. doi :10.1145/2641190.2641198 . ISSN 1931-0145 . Процитовано 28 травня 2022 .
↑ Olson, Randal S.; La Cava, William; Orzechowski, Patryk; Urbanowicz, Ryan J.; Moore, Jason H. (11 грудня 2017). PMLB: a large benchmark suite for machine learning evaluation and comparison . BioData Mining . Т. 10, № 1. с. 36. doi :10.1186/s13040-017-0154-4 . ISSN 1756-0381 . PMC 5725843 . PMID 29238404 . Процитовано 28 травня 2022 . {{cite news }}
: Обслуговування CS1: Сторінки з PMC з іншим форматом (посилання ) Обслуговування CS1: Сторінки із непозначеним DOI з безкоштовним доступом (посилання )
↑ а б Appen, Ralf von (2020). Analyzing and Interpreting Song Forms . The Bloomsbury Handbook of Rock Music Research . doi :10.5040/9781501330483.ch-007 . Процитовано 28 травня 2022 .
Диференційовні обчислення
Загальне Поняття Мови програмування Застосування Апаратне забезпечення Програмні бібліотеки Втілення
Аудіовізуальні Словесні Вирішувальні
Люди Організації