У корпусній лінгвістиці, розмічування частин мови (англ. part-of-speech tagging, POS tagging, POST), також називається граматичним позначенням або розбором на частини мови, це процес позначення слова в тексті (корпусі) належним до певної частини мови,[1] заснований як на його визначенні, так і на його контексті — тобто, на його зв'язку з суміжними і спорідненими словами у фразі, реченні, або абзаці. Спрощена форма корпусної лінгвістики зазвичай викладається дітям шкільного віку, у вигляді визначення слів як іменник, дієслово, прикметник, прислівник, тощо.
Зумівши виконати визначення частин мови вручну, це почали робити в контексті обчислювальної лінгвістики, використовуючи алгоритми, які асоціюють дискретні терміни, а також приховані частини мови, відповідно до набору описових позначень. Алгоритми розбору на частини мови поділяються на дві відмінні групи: на основі правил і на стохастичні. Розбірник Е. Брілла[en], один з перших і найбільш широко використовуваних англійських розбірників, використовує алгоритми на основі правил.
Ліс ще дрімає(теперишній час, чоловічий рід, однина) в передранішній тиші... Непорушно стоять( теперишній час, множина) дерева, загорнені в сутінь, рясно вкриті кра росою. Тихо навкруги, мертво... Лиш де-не-де прокинеться(майбутній час, жіночий рід, однина) пташка, непевним голосом обізветься(майбутній час, жіночий рід, однина) із свого затишку. Ліс ще дрімає( теперишній час, чоловічий рід, однина), а з синім небом уже щось діється( теперишній час, середній рід(не точно), однина): воно то зблідне( майбутній час, середній рід, однина), наче від жаху, то спалахне( майбутній час, середній рід, однина) сяйвом, немов від радощів. Небо міниться(теперишній час, середній рід, однина), небо граєтеперишній час, середній рід, однина) усякими барвами, блідим сяйвом торкає( теперишній час, середній рід, однина) вершечки чорного лісу... Стрепенувся(минулий час, чоловічий рід, однина) нарешті ліс і собі заграв(теперишній час, чоловічий рід, онднина)... Зашепотіли(теперишній час, множина, чоловічий рід) збуджені листочки, оповідаючи сни свої, заметушилась( теперишній час, жіночий рід, однина) у травиці комашня, розітнулося( теперешній час, середній рід, однина) в гущині голосне щебетання й полинуло( теперешній час, середній рід, однина) високо — туди, де небо міниться( теперишній час, однина, чоловічий рід), де небо грає( теперишній час, однина, чоловічий рід) всякими барвами...
У корпусній лінгвістиці, розмічування частин мови (англ. part-of-speech tagging, POS tagging, POST), також називається граматичним позначенням або розбором на частини мови, це процес позначення слова в тексті (корпусі) належним до певної частини мови,[1] заснований як на його визначенні, так і на його контексті — тобто, на його зв'язку з суміжними і спорідненими словами у фразі, реченні, або абзаці. Спрощена форма корпусної лінгвістики зазвичай викладається дітям шкільного віку, у вигляді визначення слів як іменник, дієслово, прикметник, прислівник, тощо.
Зумівши виконати визначення частин мови вручну, це почали робити в контексті обчислювальної лінгвістики, використовуючи алгоритми, які асоціюють дискретні терміни, а також приховані частини мови, відповідно до набору описових позначень. Алгоритми розбору на частини мови поділяються на дві відмінні групи: на основі правил і на стохастичні. Розбірник Е. Брілла[en], один з перших і найбільш широко використовуваних англійських розбірників, використовує алгоритми на основі правил.
Ліс ще дрімає(теперишній час, чоловічий рід, однина) в передранішній тиші... Непорушно стоять( теперишній час, множина) дерева, загорнені в сутінь, рясно вкриті кра росою. Тихо навкруги, мертво... Лиш де-не-де прокинеться(майбутній час, жіночий рід, однина) пташка, непевним голосом обізветься(майбутній час, жіночий рід, однина) із свого затишку. Ліс ще дрімає( теперишній час, чоловічий рід, однина), а з синім небом уже щось діється( теперишній час, середній рід(не точно), однина): воно то зблідне( майбутній час, середній рід, однина), наче від жаху, то спалахне( майбутній час, середній рід, однина) сяйвом, немов від радощів. Небо міниться(теперишній час, середній рід, однина), небо граєтеперишній час, середній рід, однина) усякими барвами, блідим сяйвом торкає( теперишній час, середній рід, однина) вершечки чорного лісу... Стрепенувся(минулий час, чоловічий рід, однина) нарешті ліс і собі заграв(теперишній час, чоловічий рід, онднина)... Зашепотіли(теперишній час, множина, чоловічий рід) збуджені листочки, оповідаючи сни свої, заметушилась( теперишній час, жіночий рід, однина) у травиці комашня, розітнулося( теперешній час, середній рід, однина) в гущині голосне щебетання й полинуло( теперешній час, середній рід, однина) високо — туди, де небо міниться( теперишній час, однина, чоловічий рід), де небо грає( теперишній час, однина, чоловічий рід) всякими барвами...