Share to: share facebook share twitter share wa share telegram print page

Семантическая сеть

Пример семантической сети

Семанти́ческая сеть — информационная модель предметной области, имеет вид ориентированного графа. Вершины графа соответствуют объектам предметной области, а дуги (рёбра) задают отношения между ними. Объектами могут быть: понятия, события, свойства, процессы[1]. Таким образом, семантическая сеть — это один из способов представления знаний.

В названии соединены термины из двух наук: семантика в языкознании изучает смысл единиц языка, а сеть в математике представляет собой разновидность графа — набора вершин, соединённых дугами (рёбрами), которым присвоено некоторое число. В семантической сети роль вершин выполняют понятия базы знаний, а дуги (причем направленные) задают отношения между ними. Таким образом, семантическая сеть отражает семантику предметной области в виде понятий и отношений.

Неправильно приравнивать друг другу понятия «Семантическая сеть» (англ. Semantic Network) и «Семантическая паутина» (англ. Semantic Web). Хотя эти понятия не эквивалентны, тем не менее, они связаны (см. ниже).

История

Идея систематизации на основе каких-либо семантических отношений предлагалась ещё учёными ранней науки. Примером этого может служить биологическая классификация Карла Линнея 1735 г. Если рассматривать её как семантическую сеть, то в данной классификации используется отношение подмножества, современное AKO (от англ. «A Kind Of», «разновидность»).

Прародителями современных семантических сетей можно считать экзистенциальные графы, предложенные Чарльзом Пирсом в 1909 г. Они использовались для представления логических высказываний в виде особых диаграмм. Пирс назвал этот способ «логикой будущего».

Важным направлением в исследовании сетей стали работы немецкого психолога Отто Зельца 1913 и 1922 гг. В них для организации структур понятий и ассоциаций, а также изучения методов наследования свойств он использовал графы и семантические отношения. Исследователи М. Андерсон (1973), Д. Норман (1975) и другие использовали эти работы для моделирования человеческой памяти и интеллектуальных свойств.

Компьютерные семантические сети были детально разработаны Ричардом Риченсом (англ.) в 1956 году в рамках проекта Кембриджского центра изучения языка по машинному переводу. Процесс машинного перевода подразделяется на 2 части: перевод исходного текста в промежуточную форму представления, а затем эта промежуточная форма транслируется на нужный язык. Такой промежуточной формой как раз и были семантические сети. В 1961 г. появилась работа Мастерман (англ.), в которой она, в частности, определяла базовый словарь для 15000 понятий. Эти исследования были продолжены Робертом Симмонсом (1966), Й. Уилксом (1972) и другими учёными.

Труды по семантическим сетям часто ссылаются на работу американского психолога Росса Квиллиана (Quillian) о «семантической памяти»[2].

Структура

Математика позволяет описать большинство явлений в окружающем мире в виде логических высказываний. Семантические сети возникли как попытка визуализации математических формул. Основным представлением для семантической сети является граф. Однако не стоит забывать, что за графическим изображением непременно стоит строгая математическая запись и что обе эти формы отображают одно и то же.

Графическое представление

Основной формой представления семантической сети является граф. Понятия семантической сети записываются в овалах или прямоугольниках и соединяются стрелками с подписями — дугами (см. рис.). Это наиболее удобно воспринимаемая человеком форма. [источник не указан 4560 дней] Её недостатки проявляются, когда мы начинаем строить более сложные сети или пытаемся учесть особенности естественного языка. Схемы семантических сетей, на которых указаны направления навигационных отношений, называют картами знаний, а их совокупность, позволяющая охватить большие участки семантической сети, атласом знания.

Математическая запись

В математике граф представляется множеством вершин V и множеством отношений между ними E. Используя аппарат математической логики, приходим к выводу, что каждая вершина соответствует элементу предметного множества, а дуга — предикату.

Лингвистическая запись

В лингвистике отношения фиксируются в словарях и в тезаурусах. В словарях в определениях через род и видовое отличие родовое понятие занимает определённое место. В тезаурусах в статье каждого термина могут быть указаны все возможные его связи с другими родственными по теме терминами. От таких тезаурусов необходимо отличать тезаурусы информационно-поисковые с перечнями ключевых слов в статьях, которые предназначены для работы дескрипторных поисковых систем.

Классификация семантических сетей

Для всех семантических сетей справедливо разделение по арности и количеству типов отношений.

  • По количеству типов отношений, сети могут быть однородными и неоднородными.
    • Однородные сети обладают только одним типом отношений (стрелок), например, таковой является вышеупомянутая классификация биологических видов (с единственным отношением AKO).
    • В неоднородных сетях количество типов отношений больше одного. Классические иллюстрации данной модели представления знаний представляют именно такие сети. Неоднородные сети представляют больший интерес для практических целей, но и большую сложность для исследования. Неоднородные сети можно представлять как переплетение древовидных многослойных структур. Примером такой сети может быть Семантическая сеть Википедии.
  • По арности:
    • типичными являются сети с бинарными отношениями (связывающими ровно два понятия). Бинарные отношения очень просты и удобно изображаются на графе в виде стрелки между двух концептов. Кроме того, они играют исключительную роль в математике.
    • На практике, однако, могут понадобиться отношения, связывающие более двух объектов — N-арные. При этом возникает сложность — как изобразить подобную связь на графе, чтобы не запутаться. Концептуальные графы (см. ниже) снимают это затруднение, представляя каждое отношение в виде отдельного узла.
  • По размеру:
    • Для решения конкретных задач, например, тех, которые решают системы искусственного интеллекта.
    • Семантическая сеть отраслевого масштаба должна служить базой для создания конкретных систем, не претендуя на всеобщее значение.
    • Глобальная семантическая сеть. Теоретически такая сеть должна существовать, поскольку всё в мире взаимосвязано. Возможно, когда-нибудь такой сетью станет Всемирная паутина.

Помимо концептуальных графов существуют и другие модификации семантических сетей, это является ещё одной основой для классификации (по реализации). См. более подробно в соответствующем разделе ниже.

Семантические отношения

Количество типов отношений в семантической сети определяется её создателем, исходя из конкретных целей. В реальном мире их число стремится к бесконечности. Каждое отношение является, по сути, предикатом, простым или составным. Скорость работы с базой знаний зависит от того, насколько эффективно реализованы программы обработки нужных отношений.

Иерархические

Наиболее часто возникает потребность в описании отношений между элементами, множествами и частями объектов. Отношение между объектом и множеством, обозначающим, что объект принадлежит этому множеству, называется отношением классификации (ISA). Говорят, что множество (класс) классифицирует свои экземпляры.[3] (пример: «Шарик является собакой» = Шарик является объектом типа собака). Иногда это отношение именуют также MemberOf, InstanceOf или подобным образом. Связь ISA предполагает, что свойства объекта наследуются от множества. Обратное к ISA отношение используется для обозначения примеров, поэтому так и называется — «Example», или по-русски «Пример». Иерархические отношения образуют древовидную структуру.

  • Отношение между надмножеством и подмножеством (называется AKO — «A Kind Of», «разновидность»). (Пример: «собака является животным» = тип с именем собака является подтипом типа животные). Элемент подмножества называется гипонимом (собака), а надмножества — гиперонимом (животное), а само отношение называется отношением гипонимии. Альтернативные названия — «SubsetOf» и «Подмножество». Это отношение определяет, что каждый элемент первого множества входит и во второе (выполняется ISA для каждого элемента), а также логическую связь между самими подмножествами: что первое не больше второго и свойства первого множества наследуются от второго. Отношение АКО (Род-Вид) часто используется для навигации в информационном пространстве.
  • Объект, как правило, состоит из нескольких частей, или элементов. Например, компьютер состоит из системного блока, монитора, клавиатуры, мыши и т. д. Важным отношением является HasPart, описывающее связь частей и целого — отношение меронимии. В этом случае свойства первого множества не наследуются вторым. Мероним и холоним — противоположные понятия:
    • Мероним — объект, являющийся частью для другого. (Двигатель — мероним автомобиля.)
    • Холоним — объект, который включает в себя другое. (Например, у дома есть крыша. Дом — холоним крыши. Компьютер — холоним монитора.)

Часто в семантических сетях требуется определить отношения синонимии и антонимии. Эти связи либо дублируются явно в самой сети, либо определяются алгоритмической составляющей.

Вспомогательные

В семантических сетях часто используются также следующие отношения[источник не указан 1515 дней]:

  • функциональные связи (определяемые обычно глаголами «производит», «влияет»…);
  • количественные (больше, меньше, равно…);
  • пространственные (далеко от, близко от, за, под, над…);
  • временные (раньше, позже, в течение…);
  • атрибутивные (иметь свойство, иметь значение);
  • логические (И, ИЛИ, НЕ);
  • лингвистические.

Этот список может сколь угодно продолжаться: в реальном мире количество отношений огромно. Например, между понятиями может использоваться отношение «совершенно разные вещи» или подобное: Не_имеют_отношения_друг_к_другу(Солнце, Кухонный_чайник).

Особенности использования некоторых типов отношений

В семантической сети в качестве понятий могут быть как экземпляры объектов, так и их множества. Использование одних и тех же отношений и для элементов, и для коллекций может привести к недоразумениям. Подобные ошибки в работе некоторых первых систем были описаны в статье Дрю Макдермотта[англ.] «Искусственный интеллект сталкивается с естественной глупостью».

Рассмотрим пример — четыре предложения:

  1. У Павла есть отец по имени Алексей.
  2. Для Павла найдётся отец из множества мужчин.
  3. Найдется человек, для которого Алексей — отец.
  4. У каждого человека есть отец из множества мужчин.

Для человека ясен смысл этих фраз и многие не задумываясь поставили бы во всех четырёх случаях отношение есть отец. Однако это является ошибкой: в первом случае, действительно, описывается отношение между двумя экземплярами, но во втором и третьем — между экземпляром и множеством, а в четвёртом — отношение между представителями из двух множеств. В математической записи это выглядит так, соответственно для предложений 1—4:

  I.  ∃ павел & ∃ алексей : отец(алексей, павел);
 IIа. ∃ павел → ∃ x ∈ мужчины : отец(x, павел);
 IIб. ∃ алексей → ∃ y ∈ люди : отец(алексей, y);
III.  ∀ y ∈ люди → ∃ x ∈ мужчины : отец(x, y);

Мы видим, что случаи IIа и IIб различаются только порядком следования переменных в предикате, однако для правильности сети это может сыграть важную роль. В примере перечислены лишь 4 рода отношений, всего же для бинарной сети их существует девять. Они различаются кванторами ∃ и ∀, а также порядком переменных.

Графически для отличия всех этих случаев применяют специальные форму пометок отношений на графе: например, отношения первого рода оставляют без изменений, второго — обводят прямоугольной рамкой из точек, третьего — тире, а четвёртого — тире-точка. Либо можно просто написать рядом индекс типа отношения.

Наиболее часто встречающаяся путаница возникает насчёт отношения ISA. Поэтому во многих современных работах принимается, что ISA обозначает связь между экземпляром и множеством (вышеописанный случай IIб): Мурка ISA кошка. Одиночная рамка при этом не используется. Если требуется определить отношение эквивалентности (случай I), для этого может вводиться специальное отношение (хотя для семантической сети нужда в нём небольшая). ISA можно использовать для обозначения вхождения элементов одного множества в другое (случай III), однако так делать не рекомендуется. Для обозначения подмножеств применяется ещё одно специальное отношение — AKO. Различие между «ISA в рамке» и AKO заключается в том, что последнее отвечает ещё и за наследование свойств самих множеств, а не только элементов.

Использование семантических сетей

Семантизация

Семантизация — процесс изменения текстов, в которых выделяются семантические отношения без изменения их содержания. В Википедии существуют проекты по семантизации статей и Дерева категорий.

  • Семантизация статей производится, в основном, путём использования шаблонов, при этом некоторые категории создаются автоматически.
  • Семантизация Дерева категорий заключается в соблюдении транзитивности, создании метакатегорий и организации структуры подкатегорий, используя значимые критерии.

Семантическая паутина

Концепция организации гипертекста напоминает однородную бинарную семантическую сеть, однако здесь есть существенное отличие:

  1. Связь, осуществляемая гиперссылкой, не имеет семантики, то есть не описывает смысла этой связи. Назначение семантической сети состоит в том, чтобы описать взаимосвязи объектов, а не дополнительную информацию по предметной области. Человек может разобраться, зачем нужна та или иная гиперссылка, но компьютеру эта связь не понятна.
  2. Страницы, связываемые гиперссылками, являются документами, описывающими, как правило, проблемную ситуацию в целом. В семантической сети вершины (то, что связывают отношения) представляют собой понятия или объекты реального мира.

Попытка создания семантической сети на основе Всемирной паутины получила название семантической паутины. Эта концепция подразумевает использование языка RDF (языка разметки на основе XML) и призвана придать ссылкам некий смысл, понятный компьютерным системам. Это позволит превратить Интернет в распределённую базу знаний глобального масштаба.

Программное обеспечение

См. также

Примечания

  1. Roussopoulos N.D. A semantic network model of data bases. — TR No 104, Department of Computer Science, University of Toronto, 1976.
  2. Quillian, M. R. (1968). Semantic memory. Semantic information processing, 227—270.
  3. Основные понятия. Дата обращения: 15 апреля 2007. Архивировано 25 января 2007 года.
Read more information:

Artikel ini tidak memiliki bagian pembuka yang sesuai dengan standar Wikipedia. Mohon tulis paragraf pembuka yang informatif sehingga pembaca dapat memahami maksud dari Neon tetra. Contoh paragraf pembuka Neon tetra adalah .... (March 2021) (Pelajari cara dan kapan saatnya untuk menghapus pesan templat ini) Neon tetra Paracheirodon innesi TaksonomiKerajaanAnimaliaFilumChordataKelasActinopteriOrdoCharaciformesFamiliCharacidaeGenusParacheirodonSpesiesParacheirodon innesi (Myers, 1936) Tata namaSin…

Kastel Klaipėda pada abad ke-17. Kastel Klaipėda, juga dikenal dengan nama Memelburg atau Kastel Memel, adalah situs arkeologi yang terletak di dekat Laut Baltik di Klaipėda, Lituania. Kastel ini dibangun oleh Ordo Teutonik dan mereka menyebutnya dengan nama Memelburg atau Memel,[1] dan Klaipėda sendiri dikenal dengan nama Memel hingga tahun 1923.[2] Kastel ini pertama kali disebutkan di dalam sumber tertulis pada tahun 1252 dan pernah beberapa kali dihancurkan dan dibangun k…

Nama ini menggunakan cara penamaan Spanyol: nama keluarga pertama atau paternalnya adalah Smalls dan nama keluarga kedua atau maternalnya adalah Rodríguez. Joan SmallsJoan Smalls pada 2015LahirJoan Smalls Rodríguez11 Juli 1988 (umur 35)Hatillo, Puerto Rico[1]Nama lainJoanji, Joan, Joan RodriguezAlmamaterInteramerican University of Puerto RicoInformasi modelingTinggi1,79 m (5 ft 10+1⁄2 in)[1]Warna rambutCoklatWarna mataCoklatManajerIMG Models …

Fardeen Khan फ़र्दीन ख़ान فردین خانNama lainFardeen F K JuniorPekerjaanAktorTahun aktif1998 - presentSuami/istriNatasha Madhvani (2005 - present)Orang tuaFeroz Khan Sundari Fardeen Khan (Hindi: फ़र्दीन ख़ान, bahasa Urdu: فردین خان, lahir 8 Maret 1974) adalah seorang Aktor Bollywood, Fardeen adalah anak dari pasangan Aktor Feroz Khan dan Sundari. Kehidupan Awal Fardeen Khan adalah putera Sundari dan Aktor sekaligus Sutr…

Katedral CharlotteKatedral Santo PatrickCathedral of Saint PatrickKatedral CharlotteLocation in North Carolina35°12′20″N 80°50′44″W / 35.2055°N 80.8456°W / 35.2055; -80.8456Koordinat: 35°12′20″N 80°50′44″W / 35.2055°N 80.8456°W / 35.2055; -80.8456Lokasi1621 Dilworth Road East Charlotte, North CarolinaNegaraAmerika SerikatDenominasiGereja Katolik RomaSitus webwww.stpatricks.orgSejarahDidirikan1938Tanggal konsekrasi4 September…

Untuk genre musik soul, lihat brown-eyed soul. Brown Eyed Soul브라운 아이드 소울Informasi latar belakangAsalKorea SelatanGenreK-pop, R&BTahun aktif2003–sekarangSitus webSanta MusicAnggotaJung-yup Na-ul Sung-hoon Young-jun Templat:Korean membutuhkan parameter |hangul=. Brown Eyed Soul (hangul: 브라운 아이드 소울) adalah sebuah grup R&B Korea Selatan beranggotakan 4 orang. Genre musik mereka adalah R&B, Soul, dengan beberapa melodi Ballad Korea. Anggota Ahn J…

منتخب هونغ كونغ تحت 20 سنة لكرة القدم بلد الرياضة هونغ كونغ  الفئة كرة قدم تحت 20 سنة للرجال  [لغات أخرى]‏  رمز الفيفا HKG  مشاركات تعديل مصدري - تعديل   منتخب هونغ كونغ تحت 20 سنة لكرة القدم (بالإنجليزية: Hong Kong national under-20 football team)‏ هو ممثل هونغ كونغ الرسمي في المنافس…

Third period of the Paleoproterozoic Era Orosirian2050 – 1800 Ma Pha. Proterozoic Archean Had. A map of Earth as it appeared during the early Orosirian, c. 2 GaChronology−2060 —–−2040 —–−2020 —–−2000 —–−1980 —–−1960 —–−1940 —–−1920 —–−1900 —–−1880 —–−1860 &…

Liga Super MalaysiaMusim2019Tanggal1 Februari – 21 Juli 2019Jumlah pertandingan84Jumlah gol233 (2,77 per pertandingan)Kemenangan kandangterbesarMelaka United 6–0 Felda United(15 Mei 2019)Kemenangan tandangterbesarTerengganu FC I 3–5 PJ City(14 Mei 2019)Pertandingan terbanyak gol8 gol Terengganu FC 3–5 PJ City(14 Mei 2019) Menang beruntun terpanjang3 pertandingan Johor Darul Takzim Pahang Selangor PKNP PJ City Tak kalahberuntun terpanjang14 pertandingan Johor Darul Takzim Tak menang …

William CowperWilliam CoeperLahir(1731-11-26)26 November 1731Great Berkhamstead, Hertfordshire, InggrisMeninggal25 April 1800(1800-04-25) (umur 68)East Dereham, Norfolk, InggrisPekerjaanPenulis, Penyair, Rektor William Cowper (26 November 1731 – 25 April 1800) adalah seorang penyair dan penulis Inggris.[1] Beberapa puisi karyanya antara lain: Retirement[2][3] Contentment[2][3] Hatred and vengeance, my eternal portion[2][3&#…

Serie D 1974-1975 Competizione Serie D Sport Calcio Edizione 16ª Organizzatore Lega Semiprofessionisti Luogo  Italia Partecipanti 162 Formula 9 gironi all'italiana. Risultati Promozioni AlbesePro PatriaTrevisoAnconitanaPistoieseOlbiaPotenzaCampobassoCosenza Retrocessioni (le squadre scritte in corsivo sono poi state ripescate)Aosta, CastellamonteLevante Genova, MedaCrema, Passirio MeranoRovigo, CaorleThiene, Bellaria Igea MarinaGubbio, FelinoGrifo Cannara, Città di CastelloCamaiore, Orvie…

Paul Volcker Ketua Dewan Penasihat Pemulihan Ekonomi PresidenMasa jabatan6 Februari 2009 – 6 Februari 2011PresidenBarack Obama PendahuluJabatan baruPenggantiJeff Immelt (Dewan tentang Pekerjaan dan Daya Saing)Ketua Federal Reserve ke-12Masa jabatan6 Agustus 1979 – 11 Agustus 1987PresidenJimmy CarterRonald ReaganWakilFrederick SchultzPreston MartinManley Johnson PendahuluWilliam MillerPenggantiAlan GreenspanPresiden Federal Reserve Bank New YorkMasa jabatan2 Mei 1975 …

BBFC beralih ke halaman ini. Untuk kegunaan lain, lihat BBFC (disambiguasi). British Board of Film ClassificationTanggal pendirian1912; 112 tahun lalu (1912)TipeLSMTujuanPenilaian film, Penilaian televisiKantor pusatLondon, Inggris, Britania RayaWilayah layanan Britania RayaPresidenPatrick SwafferKepala EksekutifDavid AustinSitus webwww.bbfc.co.uk British Board of Film Classification (BBFC), sebelumnya British Board of Film Censors, adalah lembaga swadaya masyarakat yang didirikan oleh indu…

False or misleading virus information Disinfodemic – Deciphering COVID-19 disinformation, published by UNESCO Part of a series on theCOVID-19 pandemicScientifically accurate atomic model of the external structure of SARS-CoV-2. Each ball is an atom. COVID-19 (disease) SARS-CoV-2 (virus) Cases Deaths Timeline 2019 2020 January responses February responses March responses April responses May responses June responses July responses August responses September responses October responses November r…

2001 video game 2001 video gameResident Evil Survivor 2 – Code: VeronicaEuropean PlayStation 2 box artDeveloper(s)Capcom, Namco, Nextech, SIMS Co., Ltd.Publisher(s)Capcom, NamcoComposer(s)Hiroshi IgarashiSeriesResident EvilPlatform(s)Arcade, PlayStation 2ReleaseArcadeJP: July 2001PlayStation 2JP: November 8, 2001EU: March 22, 2002Genre(s)Light gun shooterMode(s)Single-playerArcade systemSega NAOMI Resident Evil Survivor 2 – Code: Veronica[a] is a light gun shooter video game develope…

3β-Androstanediol Names IUPAC name 5α-Androstane-3β,17β-diol Systematic IUPAC name (1S,3aS,3bR,5aS,7S,9aS,9bS,11aS)-9a,11a-Dimethylhexadecahydro-1H-cyclopenta[a]phenanthrene-1,7-diol Other names 3β-Androstanediol; 3β-Diol; Maxterone Identifiers CAS Number 571-20-0 Y 3D model (JSmol) Interactive image ChEMBL ChEMBL316048 ChemSpider 211834 ECHA InfoCard 100.008.487 PubChem CID 242332 UNII 6J0K4253QD Y CompTox Dashboard (EPA) DTXSID8022379 InChI InChI=1S/C19H32O2/c1-18-9-7-13(20)11-…

Rugby teamBarkingFull nameBarking Rugby Union Football ClubUnionEssex RFUFounded1930; 94 years ago (1930)LocationBecontree, Dagenham, London, EnglandGround(s)Goresbrook (Capacity: 1,000)Captain(s)Stephen Hayes, Ross MyersLeague(s)Essex 12021–22= www.pitchero.com/clubs/barkingrufc/ Team kit The main stand at Goresbrook Barking RFC is an English rugby union team based in Barking, east London and currently play in the ninth tier of the English rugby union league system, Essex 1.…

Luísa SonzaSonza tahun 2023LahirLuísa Gerloff Sonza18 Juli 1998 (umur 25)Tuparendi, Rio Grande Selatan, BrasilPekerjaanPenyanyipenulis laguTahun aktif2017–sekarangSuami/istriWhindersson Nunes ​ ​(m. 2018; c. 2020)​Karier musikGenrePopInstrumen Vokal gitar Label Universal Music Group Sony Music Luísa Gerloff Sonza (lahir 18 Juli 1998) adalah penyanyi-penulis lagu asal Brasil. Dia mulai dikenal pada tahun 2014 dengan menyanyikan lagu c…

American dancer and actress (1913–2006) This article needs additional citations for verification. Please help improve this article by adding citations to reliable sources. Unsourced material may be challenged and removed.Find sources: Delma Byron – news · newspapers · books · scholar · JSTOR (May 2020) (Learn how and when to remove this template message) Delma ByronDelma ByronBornSara Delma Bynum(1913-07-31)July 31, 1913Weakley County, TennesseeDiedMay …

Sputnik 1Replika dari Sputnik 1NamaСпутник 1Object PSProsteishiy SputnikJenis misiDemonstrasi teknologiOperatorOKB-1Identifikasi Harvard1957 Alpha 2[1]COSPAR ID1957-001B[2]SATCAT no.00002Durasi misi21 hariFrekuensi orbit1440[3] Properti wahanaProdusenOKB-1Ministry of Radiotechnical IndustryMassa luncur836 kg (1.843 pon)Dimensi58 cm (23 in) diameterDaya1 watt Awal misiTanggal luncur4 Oktober 1957, 19:28:34 (4 Oktober 1957, 19:28:34)…

Kembali kehalaman sebelumnya