Grammatical Formalisms

Postgraduate course «Technoglossia»

Stella Markantonatou

Athens, October 2012

LECTURE 1

Context Free Phrase Structure Grammars (CFPSG) and Constituency

CONTENTS

1. Two trends in the study of linguistic knowledge 1

2. The Symbolic Approach: Knowledge representation and formal languages 1

3. Context Free (CF) Grammars 2

4. Diagnostics for phrases 2

5. Application 3

6. Homework 4

7. References 5

1.  Two trends in the study of linguistic knowledge

A—Symbolic approaches

Formal languages and inferencing

B--- Quantitative approaches

Apply measurements on texts and do statistical analysis. Measurements may be applied on basic information such as n-grams. However, they often apply on symbolic information (grammatical tags, syntactic tags etc) extracted with both quantitative and symbolic processing.

2.  The Symbolic Approach: Knowledge representation and formal languages

A formal language is a set of words, that is, finite strings of letters, symbols, or tokens that are defined in the language. The set from which these are taken is the alphabet over which the language is defined. A formal language is often defined by means of a formal grammar. Formal languages are often used as the basis for richer constructs endowed with semantics.

Example

Vocabulary {N, Det, Adj, NP}

Formal Grammar NP à Det (Adj) N (NP)

Strings in the language { Det N, Det N NP, Det Adj N, Det Adj N NP, Det N Det N, ...}

A number of formal languages have been used in Linguistics: the language of transformational grammar/of Lexical Functional Grammar etc. Those languages are still evolving. Their alphabet, grammar and semantics are under constant scrutiny—if evolution had stopped then the study of natural languages would have been concluded, which is by no means the case!

3.  Context Free (CF) Grammars

Most of the formal languages used in Linguistics are Context Free (CF) ones. CF languages are described by rules of the general type (1), where A is a non terminal symbol and γ a string consisting of terminal and non terminal symbols.

(1) A à γ

A terminal symbol can not appear in the left hand of the rule (1) while a non terminal one can. Rules conforming to (1) are

NP à Det N

VP à V NP

NP, VP are non-terminal symbols. Det, N, V are terminal symbols.

Central is the notion of part of speech (also a word class, a lexical class, or a lexical category): a linguistic category of lexical items that is generally defined by the syntactic or morphological behaviour of the lexical item in question.

Most times, but not always, phrases develop around some predicate that is called the HEAD of the phrase and can be classified under one of the parts of speech that are available in the corresponding language. Sentences, however, have no lexical head. Table 1 gives an overview of the most common phrases and their names in Greek (EL) and English (EN).

Part of Speech (EL) / Phrase (EL) / ABBR / Part of Speech (EN) / Phrase (EN) / ΑΒΒR
Όνομα / Ονοματική Φράση / ΟΦ / Noun / Noun Phrase / ΝΡ
Ρήμα / Ρηματική Φράση / ΡΦ / Verb / Verb Phrase / VP
Επίθετο / Επιθετική Φράση / ΕΦ / Adjective / Adjectival Phrase / AP
Πρόθεση / Προθετική Φράση / ΠΡΟΘΦ / Preposition / Prepositional Phrase / PP
Επίρρημα / Επιρρηματική Φράση / ΕπιρΦ / Adverb / Adverbial Phrase / AdvP
Πρόταση / Π / Sentence / S

Table 1. Parts of speech and corresponding phrases in Greek (EL) and English (EN)

4.  Diagnostics for phrases

(1)  Distribution: the same string of words (morphology does not matter) can fulfill different grammatical functions.

Subject

Οι ποδοσφαιριστές μπήκαν στο γήπεδο

The footballers entered the football pitch.

Object

Τα πλήθη καλωσορίζουν τους ποδοσφαιριστές

The crowds welcome the footballers.

Phrase introduced with a preposition

Έχουν γραφτεί τόσα πολλά για τους ποδοσφαιριστές

So many things have been written about the footballers.

(2)  Substitution: A phrasal constituent can be replaced by pronouns.

Οι ποδοσφαιριστές μπήκαν στο γήπεδο --- Ποιοι μπήκαν στο γήπεδο?

The footballers entered the football pitch --- Who entered the football pitch?

Τα πλήθη καλωσορίζουν τους ποδοσφαιριστές --- Ποιους καλωσορίζουν τα πλήθη?

The crowds are welcoming the footballers --- Whom are the crowds welcoming?

Έχουν γραφτεί πολλά για τους ποδοσφαιριστές --- Για ποιους έχουν γραφτεί πολλά?

So many things have been written about the footballers --- About whom have so many things been written?

-Βαριέμαι την Υπολογιστική Γλωσσολογία—I am bored of Computational Linguistics.

-Το ίδιο και εγώ – So am I.

(3)  Coordination (…caution!!!)

Θέλω [μακαρονάδα και παγωτό].

I would like [spaghetti and ice cream].

*Θέλω [μακαρονάδα και έρχεται ο Γιάννης].

* I would like [spaghetti and John is coming].

Πήγα [στην αγορά και στην θάλασσα].

I went [to the market and to the sea].

*Πήγα [στην αγορά και πόλη].

*I went [to the market and town].

However, coordination is possible across non-phrasal constituents --- so this is a sufficient but not a necessary condition:

Έδωσα [χρήματα] [στην Ελένη] και [την αγάπη μου] [στον Φάνη].

I gave [money] [to Helen] and [my love] [to Fanis].

5.  Application

In the Greek text below there are several NPs (phrases built around a noun). In Table 2, some of those NPs are listed in the leftmost column. In the next columns are listed the diagnostics used to identify them.

Μέσα στην ένταση και την τρέλα των στιγμών γίνονται δύο μεγάλα λάθη. Το πρώτο είναι η ανεξέλεγκτη δαιμονοποίηση των δημοσίων υπαλλήλων, γενικώς και αορίστως.

NPs / Distribution / Substitution / Coordination
Μέσα στην ένταση και την τρέλα των στιγμών γίνονται δύο μεγάλα λάθη / Μέσα στην ένταση και την τρέλα των στιγμών γίνονται δύο μεγάλα λάθη. / Τί γίνεται μέσα στην τρέλα και ένταση των στιγμών? / Μέσα στην ένταση και την τρέλα των στιγμών γίνονται δύο μεγάλα λάθη και δύο επικίνδυνες αβλεψίες.
Έκανα δύο μεγάλα λάθη. / Τί έκανες?
Έστρεψαν την προσοχή τους στα δύο μεγάλα λάθη αγνοώντας τα μικρότερα. / Σε τί έστρεψαν την προσοχή τους?
η ανεξέλεγκτη δαιμονοποίηση των δημοσίων υπαλλήλων / Το πρώτο είναι η ανεξέλεγκτη δαιμονοποίηση των δημοσίων υπαλλήλων, γενικώς και αορίστως. / Ποιο ειναι το πρώτο?
*Ποιο είναι το πρώτο, γενικώς και αορίστως? / Το πρώτο είναι η ανεξέλεγκτη δαιμονοποίηση των δημοσίων υπαλλήλων, γενικώς και αορίστως και η πάνδημη κατακραυγή τους.
Αποδέχονται εύκολα την ανεξέλεγκτη δαιμονοποίηση των δημοσίων υπαλλήλων, γενικώς και αορίστως. / Τί αποδέχονται εύκολα?
η ανεξέλεγκτη δαιμονοποίηση των δημοσίων υπαλλήλων / η ανεξέλεγκτη δαιμονοποίηση των δημοσίων υπαλλήλων / η ανεξέλεγκτη δαιμονοποίησή τους
Ποιανών η ανεξέλεγκτη δαιμονοποίηση ...? / η ανεξέλεγκτη δαιμονοποίηση των δημοσίων υπαλλήλων και των ιδιωτικών μεταφορέων
Οι δημόσιοι υπάλληλοι δαιμονοποιούνται / Ποιοι δαιμονοποιούνται?
Δαιμονοποιούν τους δημόσιους υπαλλήλους. / Ποιους δαιμονοποιούν?

Table 2. NPs and the identification diagnostics

Note on Table 2. Substitution. Actually, the application of the criterion says that the set of words in question is a phrasal constituent in a given environment. A phrasal constituent is a structured set of words that plays a certain syntactic role in a phrase as such. The substitution criterion actually shows that a particular set of words fills a certain syntactic slot in the phrase.

6.  Homework

1.  In the text below underline the Noun Phrases (NPs). NPs are phrases that are built around a noun. However, NPs may contain many more things than a noun: they may contain relative clauses, other types of subordinated clause, a series of genitives etc

2.  Create a table with as many columns and as many lines as necessary. In the leftmost column list the NPs you identified in the second paragraph of the text (the yellow one). In the remaining columns indicate the diagnostics you used to identify each case. Take Table 2 as an example

H KAΘΗΜΕΡΙΝΗ Hμερομηνία :28-09-11

Η ανεξέλεγκτη δαιμονοποίηση

Του Αλεξη Παπαχελα

Μέσα στην ένταση και την τρέλα των στιγμών γίνονται δύο μεγάλα λάθη. Το πρώτο είναι η ανεξέλεγκτη δαιμονοποίηση των δημοσίων υπαλλήλων, γενικώς και αορίστως. Ωστόσο είναι άλλο πράγμα να μιλάμε για την ανάγκη μείωσης του δημόσιου τομέα και άλλο να τα βάζουμε προσωπικά με όποιον έτυχε να πάρει σύνταξη στα 50 ή να προσελήφθη σε μία ΔΕΚΟ χωρίς ιδιαίτερα προσόντα. Πηγαίνετε λίγο πίσω, όχι και πολύ πίσω, και σκεφθείτε πώς δούλευε το σύστημα. Ενας Ελληνας πολίτης τελείωνε μια σχολή και είχε τη βεβαιότητα ότι θα προσληφθεί στο Δημόσιο, γιατί «έτσι γινόταν». Ο άνθρωπος δεν είχε ιδέα ούτε για τη... δυναμική του χρέους ούτε για τίποτε άλλο. Ακολουθούσε πιστά τους κανόνες και τις παραδόσεις μιας κοινωνίας και ενός πολιτικού συστήματος.

Αίφνης, ο εν λόγω άνθρωπος νιώθει ότι έχασε το έδαφος κάτω από τα πόδια του. Εχει κάνει τους λογαριασμούς του και τα κουμάντα του με βάση την αρχική «σύμβαση» με το πολιτικό σύστημα. Ηταν βέβαιος ότι θα έχει μια αξιοπρεπή σύνταξη, ότι θα μπορεί να πληρώνει τα φροντιστήρια των παιδιών του και τα κοινόχρηστα, χωρίς να σκέφτεται πότε θα ανάψει το καλοριφέρ. Υπάρχουν βεβαίως και οι εξαιρέσεις, όπως οι 50άρηδες συνταξιούχοι ΔΕΚΟ με μεγάλη σύνταξη που δουλεύουν και σε μια «μαύρη» εργασία... Δεν είναι όμως η πλειοψηφία. Είναι λάθος να δαιμονοποιούμε αυτούς τους ανθρώπους επειδή βρήκαν μια δουλειά - όπως έκανε και ο υπόλοιπος κόσμος.

Exercise 2. XLFG: https://signes.bordeaux.inria.fr/xlfg5/index.php

Tutorial1. Getting familiar with XLFG.

7.  References

Δήμητρα Θεοφανοπούλου-Κοντού. 1989. Μετασχηματιστική Σύνταξη. Από την θεωρία στην πράξη. Αθήνα: Εκδόσεις Καρδαμίτσα

Dalrymple, Mary. 2002. Syntax and Semantics 34: Lexical Functional Grammar. Academic Press

5