Constraint-Programmierung—Beispiel

(set-logic QF_NIA)(set-option :produce-models true)
(declare-fun P () Int) (declare-fun Q () Int)
(declare-fun R () Int) (declare-fun S () Int)
(assert (and (< 0 P) (<= 0 Q) (< 0 R) (<= 0 S)))
(assert (> (+ (* P S) Q) (+ (* R Q) S)))
(check-sat)(get-value (P Q R S))

Constraint-System: eine prädikatenlogische Formel $F$

$0 < P\wedge \dots \wedge P\cdot S + Q > R \times Q + S$
Lösung: Interpretation (Var.-Belegung), für die $F$ wahr ist
CP ist eine Form der deklarativen Programmierung.
Vorteil: Benutzung von allgemeinen Suchverfahren (bereichs-, aber nicht anwendungsspezifisch).

Industrielle Anwendungen der CP

Verifikation von Schaltkreisen
(bevor man diese tatsächlich produziert)

$F = \text{S-Implementierung}(x) \neq \text{S-Spezifikation}(x)$

wenn $F$ unerfüllbar ($\neg \exists x$), dann Implementierung korrekt
Verifikation von Software durch model checking:

Programmzustände abstrahieren durch Zustandsprädikate, Programmabläufe durch endliche Automaten.

z. B. Thomas Ball et al. 2004: Static Driver Verifier

https://www.microsoft.com/en-us/research/project/slam/publications/

benutzt Constraint-Solver Z3 (Nikolaj Björner et al., 2007–)

https://github.com/Z3Prover/z3/wiki

Industrielle Anwendungen der CP

automatische Analyse des Resourcenverbrauchs von Programmen
- Termination (jede Rechnung hält)
- Komplexität (…nach $O(n^2)$ Schritten)
mittels Bewertungen von Programmzuständen:
- $W : \text{Zustandsmenge} \to \mathbb{N}$
- wenn $z_1 \to z_2$, dann $W(z_1)>W(z_2)$.
Parameter der Bewertung werden durch Constraint-System beschrieben.
vgl. Carsten Fuhs: Automated Termination Analysis…, Intl. School on Rewriting, 2022

http://viam.science.tsu.ge/clas2022/isr/termination.html

CP-Anwendung: Polynom-Interpretationen

Berechnungsmodell: Wortersetzung ($\approx$ Turingmaschine)
Programm: $ab \to ba$ ($\approx$ Bubble-Sort)

Beispiel-Rechnung: $abab \to baab \to baba \to bbaa$
Bewertung $W$ durch Intepretation: lineare Funktionen $f_a(x) = Px+Q, f_b(x)=Rx+S$ mit $P,Q,R,S\in \mathbb{N}$

$W(abab) = f_a(f_b(f_a(f_b(0)))), \ldots$
Interp. ist monoton: $x > y \Rightarrow f_a(x) > f_a(y) \wedge f_b(x)>f_b(y)$
Interp. ist kompatibel mit Programm: $f_a(f_b(x) > f_b(f_a(x))$
resultierendes Constraint-System für $P,Q,R,S$,
Lösung mittels Z3

Constraints in der Unterhaltungsmathematik

Nikoli (1980–, the first puzzle magazine in Japan.)

https://www.nikoli.co.jp/en/puzzles/
Erich Friedman: Math Magic 1998–2020

https://erich-friedman.github.io/mathmagic/
Angela und Otto Janko:

http://www.janko.at/Raetsel/

,
Donald Knuth: A Potpourri of Puzzles, 2022,

TAOCP, Band 4, Pre-Faszikel 9b,

https://cs.stanford.edu/~knuth/taocp.html, https://cs.stanford.edu/~knuth/fasc9b.ps.gz

Wettbewerbe für Constraint-Solver

für aussagenlogische Formeln:

http://www.satcompetition.org/

(SAT $=$ satisfiability)
für prädikatenlogische Formeln

https://smt-comp.github.io/

(SMT $=$ satisfiability modulo theories)

Theorien: $\mathbb{Z}$ mit $\le$, Plus, Mal; $\mathbb{R}$ mit $\le$, Plus; …
Termination und Komplexität

https://www.termination-portal.org/wiki/Termination_Competition

Gliederung der Vorlesung

Aussagenlogik
- CNF-SAT-Constraints (Normalf., Tseitin-Transformation)
- DPLL-Solver, Backtracking und Lernen
- ROBDDs (Entscheidungsdiagramme)
Prädikatenlogik (konjunktive Constraints)
- Finite-Domain-Constraints
- naive Lösungsverfahren, Konsistenzbegriffe
- lineare Gleichungen, Ungleichungen, Polynomgleichungen
- Termgleichungen, Unifikation
Kombinationen
- Kodierungen nach CNF-SAT (FD, Zahlen)
- SMT, DPLL(T)

Organisatorisches

jede Woche 1 Vorlesung $+$ 1 Übung
Hausaufgaben (Haus bedeutet: zuhause bearbeiten, in der Übung diskutieren)
- Aufgaben im Skript
- Aufgaben in autotool
Prüfungszulassung: 50 Prozent der autotool-Pflichtaufgaben
Klausur (2 h, keine Hilfsmittel). — Oder?
Quelltexte, Planung und Diskussion der Übungsaufgaben

https://git.imn.htwk-leipzig.de/waldmann/cp-ws23

(VPN) (Projekt-Mitgliedschaft beantragen, Zugang wird dann auf Mitglieder eingeschränkt)

Literatur

Krzysztof Apt: Principles of Constraint Programming, https://www.cambridge.org/catalogue/catalogue.asp?isbn=9780521825832
Daniel Kroening, Ofer Strichman: Decision Procedures, Springer 2016. https://www.decision-procedures.org/
Petra Hofstedt, Armin Wolf: Einführung in die Constraint-Programmierung, Springer 2007. https://link.springer.com/book/10.1007/978-3-540-68194-6
Uwe Schöning: Logik für Informatiker, Spektrum Akad. Verlag, 2000.

Hausaufgaben

Pierluigi Crescenzi, Viggo Kann A compendium of NP optimization problems

https://web.archive.org/web/20200227195925/http://www.nada.kth.se/~viggo/problemlist/compendium.html

Beispiel: Minimum File Transfer Scheduling (node195). Erläutern Sie die Spezifikation an einem Beispiel.
Aufgabe: formalisieren Sie Math Magic Februar 2007.

Was ist dabei für Springer und König einfacher als für Dame, Läufer, Turm?

(allgemein für Math Magic: lösen Sie eine der offenen Fragen https://erich-friedman.github.io/mathmagic/unsolved.html )
Aufgabe: formalisieren Sie https://www.janko.at/Raetsel/Wolkenkratzer.
- Unbekannte: $h_{x,y}\in\{0,\dots,n-1\}$ für $x,y\in\{0,\dots,n-1\}$
- Constraint für eine Zeile $x$:
  
  $\bigvee_{p\in\text{Permutationen}(0,\dots,n-1), p \text{kompatibel mit Vorgaben}} \bigwedge_{y\in\{0,\dots,n-1\}} (h_{x,y} = p(y))$
  
  Bsp: $n=4$, Vorgabe links 2, rechts 1, kompatibel sind $[0,2,1,3],[2,0,1,3],[2,1,0,3],[2,1,0,3]$.
  
  entspr. für Spalten
- diese Formel wird exponentiell groß (wg. Anzahl Permutationen),
  
  Folge-Aufgabe: geht das auch polynomiell?
Constraint für monotone kompatible Bewertungsfunktion:
- lösen Sie mit Z3 (ist im Pool installiert, vgl. https://www.imn.htwk-leipzig.de/~waldmann/etc/pool/)
- eine kleinste Lösung finden (Summe von $P,Q,R,S$ möglichst klein) — dafür Assert(s) hinzufügen.
- Abstieg der so gefundenen Bewertungsfunktion nachrechnen für $abab\to baab \to baba\to bbaa$
- gibt diese Bewertungsfunktion die maximale Schrittzahl genau wieder? (nein)
- Folge-Aufgabe: entspr. Constraint-System für Bewertungsfunktion für $ab\to bba$ aufstellen und lösen.

Erfüllbarkeit aussagenlogischer Formeln (SAT)

Aussagenlogik: Syntax

aussagenlogische Formel:

elementar: Variable $v_1,\ldots$
zusammengesetzt: durch Operatoren
- einstellig: Negation
- zweistellig: Konjunktion, Disjunktion, Implikation, Äquivalenz

Aussagenlogik: Semantik

Wertebereich $\mathbb{B}=\{0,1\}$, Halbring $(\mathbb{B},\vee,\wedge,0,1)$

Übung: weitere Halbringe mit 2 Elementen?
Belegung ist Abbildung $b: V \to \mathbb{B}$
Wert einer Formel $F$ unter Belegung $b$: $\operatorname{val}(F,b)$
wenn $\operatorname{val}(F,b)=1$, dann ist $b$ ein Modell von $F$, Schreibweise: $b \models F$
Modellmenge $\operatorname{Mod}(F)=\{b \mid b\models F\}$
$F$ erfüllbar, wenn $\operatorname{Mod}(F)\neq\emptyset$
Modellmenge einer Formelmenge: $\operatorname{Mod}(M) = \{ b \mid \forall F \in M: b\models F\}$

Modellierung durch SAT: Ramsey

gesucht ist Kanten-2-Färbung des $K_5$ ohne einfarbigen $K_3$.

Aussagenvariablen $f_{i,j} =$ Kante $(i,j)$ ist rot (sonst blau).
Constraints:

$\forall p: \forall q: \forall r: (p<q \wedge q<r) \Rightarrow ( (f_{p,q}\vee f_{q,r} \vee f_{p,r}) \wedge \dots)$

das ist ein Beispiel für ein Ramsey-Problem

(F. P. Ramsey, 1903–1930) http://www-groups.dcs.st-and.ac.uk/~history/Biographies/Ramsey.html

diese sind schwer, z. B. ist bis heute unbekannt: gibt es eine Kanten-2-Färbung des $K_{43}$ ohne einfarbigen $K_{5}$?

http://www1.combinatorics.org/Surveys/ds1/sur.pdf

Programmbeispiel zu Ramsey

Quelltext in Ramsey.hs

num p q = 10 * p + q ; n x = negate x
f = do
  p <- [1..5] ; q <- [p+1 .. 5] ; r <- [q+1 .. 5]
  [    [ num p q, num q r, num p r, 0 ]
     , [ n $ num p q, n $ num q r, n $ num p r, 0 ] ]
main = putStrLn $ unlines $ do
  cl <- f ; return $ unwords $ map show cl

Ausführen:

runghc Ramsey.hs | minisat /dev/stdin /dev/stdout

Benutzung von SAT-Solvern

Eingabeformat: SAT-Problem in CNF:

Variable $=$ positive natürliche Zahl
Literal $=$ ganze Zahl ($\neq 0$, mit Vorzeichen)
Klausel $=$ Zeile, abgeschlossen durch $0$.
Programm $=$ Header p cnf <#Variablen> <#Klauseln>, dann Klauseln

Beispiel

p cnf 5 3
1 -5 4 0
-1 5 3 4 0
-3 -4 0

Löser: minisat input.cnf output.text

Modellierung durch SAT: $N$ Damen

stelle möglichst viele Damen auf $N\times N$-Schachbrett,
die sich nicht gegenseitig bedrohen.

Unbekannte: $q_{x,y}$ für $(x,y)\in F = \{1,\ldots,N\}^2$

mit Bedeutung: $q_{x,y}\iff$ Feld $(x,y)$ ist belegt
Constraints: $\displaystyle \bigwedge_{a,b\in F, \text{$a$ bedroht $b$}} \neg q_a\vee\neg q_b$.
möglichst viele läßt sich hier vereinfachen zu:

in jeder Zeile genau eine.

vereinfachen zu: …wenigstens eine.

Formulierung von SAT-Problemen mit Ersatz

Autoren: Edward Kmett et al.,

https://hackage.haskell.org/package/ersatz,

import Prelude hiding ((&&),(||),not )
import Ersatz
main = do
  ans <- solveWith minisat $ do 
    p <- exists @Bit ; q <- exists @Bit
    assert $ p && not q
    return [p,q]
  case ans of (Satisfied, Just res) -> print res

Unbekannte erzeugen (exists), Formel konstruieren (&&,…), assertieren, lösen, Antwort benutzen
zu Implementierung vgl.

https://www.imn.htwk-leipzig.de/~waldmann/etc/untutorial/ersatz/

$N$-Queens mit Ersatz

solveWith minisat $ do
  let n = 40
      -- f ist Liste aller Positionen (wie auf Folie)
      f = (,) <$> [0..n-1] <*> [0..n-1]
  qss <- replicateM n $ replicateM n (exists @Bit)
  let q (x,y) = qss !! x !! y
  assert $ and $ do qs <- qss; return $ or qs
  assert $ and $ do
    a <- f ; b <- f
    guard $ bedroht a b
    return $ not (q a) || not (q b)
  return qss

bedroht a@(ax,ay) b@(bx,by) = a /= b
  && (ax == bx || ay == by || abs (ax-bx) == abs(ay-by))

Zusammenfassung Ersatz (bisher)

innerhalb von solveWith:

boolesche Operatoren (not, (||), usw.)

werden angewendet auf Formeln (Typ Bit),

nicht auf Wahrheitswerte (Typ Bool)
exists @Bit konstruiert neue Variable,

ist monadische Aktion (benutze do, replicateM, usw.)
innerhalb von assert: funktional (nicht monadisch)
noch nicht behandelt haben wir diesen Widerspruch:

wir konstruieren beliebige Formel, Solver erwartet CNF

Hausaufgaben

unterschiedliche Halbringe auf zwei Elementen?
für die Formel $S(b,h)$ (abhängig von zwei Parametern $b,h\in \mathbb{N}$ )

Variablen: $v_{x,y}$ für $1\le x\le b, 1\le y \le h$

Constraints:
- für jedes $x$ gilt: wenigstens einer von $v_{x,1},v_{x,2},\dots,v_{x,h}$ ist wahr
- und für jedes $y$ gilt: höchstens einer von $v_{1,y},v_{2,y},\dots,v_{b,y}$ ist wahr
1. unter welcher Bedingung an $b,h$ ist $S(b,h)$ erfüllbar?
  
  Für den erfüllbaren Fall: geben Sie ein Modell an.
  
  Für den nicht erfüllbaren Fall: einen Beweis.
2. Erzeugen Sie (eine konjunktive Normalform für) $S(b,h)$ durch ein Programm (a - Sprache/Bibliothek beliebig, b - Haskell/Ersatz)
  
  ( $b,h$ von der Kommandozeile, Ausgabe nach stdout)
3. Lösen Sie $S(b,h)$ durch minisat (kissat, Z3, …), vergleichen Sie die Laufzeiten (auch im nicht erfüllbaren Fall).
für das angegebene Ersatz-Programm zu $N$-Queens:
- welche Größe haben die erzeugten Formeln (unter den assert)? (in Abhängigkeit von $N$)
- welche Laufzeit hat das Programm?
Für $a,b\ge 2$: die Ramsey-Zahl $R(a,b)$ ist die kleinste Zahl $n$, für die gilt: jede rot-blau-Kantenfärbung eines $K_n$ enthält einen roten $K_a$ oder einen blauen $K_b$.

(Der Satz von Ramsey ist, daß es für jedes $a,b$ tatsächlich solche $n$ gibt.)
1. Beweisen Sie:
  1. $R(a,b)=R(b,a)$
  2. $R(2,b)=b$
  3. $R(a+1,b+1)\le R(a,b+1)+R(a+1,b)$
    
    (das liefert einen Beweis des Satzes von Ramsey)
  4. wenn dabei beide Summanden rechts gerade Zahlen sind, dann $R(a+1,b+1)< \dots$
2. Bestimmen Sie damit obere Schranken für $R(3,3), R(3,4), R(4,4)$ und vergleichen Sie mit den unteren Schranken durch SAT-Kodierung.
Realisierung der SAT-Kodierung von $R(a,b)$: benutzen Sie eine Funktion, die alle Teilfolgen gegebener Länge bestimmt.

Beispiel: subs 3 [1,2,3,4,5] = [[1,2,3],[1,2,4],[1,2,5],...,[3,4,5]] (nicht notwendig in dieser Reihenfolge)
```
subs :: Int -> [a] -> [[a]]
subs 0 xs = [ [] ]
subs k [] = []
subs k (x:xs) = map _  _  <> subs k xs
```
Verwenden Sie subs a [1 .. n] zur Auswahl des $K_a$ sowie subs 2 xs zur Auswahl der Kanten.
Modellierung als aussagenlogisches Constraint:
- Rösselsprung ($=$ Hamiltonkreis)
- Norinori https://nikoli.com/en/puzzles/norinori/
- ABCEndView (oder ähnlich) https://www.janko.at/Raetsel/AbcEndView/
Vorgehen bei Modellierung:
- welches sind die Unbekannten, was ist deren Bedeutung?
  
  (Wie rekonstruiert man eine Lösung aus der Belegung, die der Solver liefert?)
- welches sind die Constraints?
  
  (wie stellt man sie in CNF dar? — falls nötig)

SAT: Normalformen, Transformationen

Normalformen (DNF, CNF)

Definitionen:

Variable: $v_1, \ldots$ Literal: $v$ oder $\neg v$
DNF-Klausel: Konjunktion von Literalen
DNF-Formel: Disjunktion von DNF-Klauseln
CNF-Klausel: Disjunktion von Literalen
CNF-Formel: Konjunktion von CNF-Klauseln

Disjunktion als Implikation: diese Formeln sind äquivalent:

$(x_1\wedge \ldots \wedge x_m)\to(y_1\vee\ldots\vee y_n)$
$(\neg x_1\vee \ldots\vee \neg x_m \vee y_1\vee\ldots\vee y_n)$

Äquivalenzen

Def: Formeln $F$ und $G$ heißen äquivalent, wenn $\operatorname{Mod}(F)=\operatorname{Mod}(G)$.
Satz: zu jeder Formel $F$ existiert äquivalente Formel $G$ in DNF.
Satz: zu jeder Formel $F$ existiert äquivalente Formel $G'$ in CNF.
aber …wie groß sind diese Normalformen?

Erfüllbarkeits-Äquivalenz

Def: $F$ und $G$ erfüllbarkeitsäquivalent, wenn $\operatorname{Mod}(F)\neq\emptyset \iff \operatorname{Mod}(G)\neq\emptyset$.
Satz: es gibt einen Polynomialzeit-Algorithmus, der zu jeder Formel $F$ eine erfüllbarkeitsäquivalente CNF-Formel $G$ berechnet.
(Zeit $\ge$ Platz, also auch $|G| = \text{Poly}(|F|)$)
Beweis (folgt): Tseitin-Transformation
Vor-Überlegung: warum gibt es keine vergleichbare Aussage für DNF?

Tseitin-Transformation

Spezifikation:

Gegeben $F$, gesucht erfüllbarkeitsäquivalentes $G$ in CNF.
wir verschärfen das zu: $\operatorname{Var}(F)\subseteq\operatorname{Var}(G)$ und $\forall b: b\models F \iff \exists b' : b \subseteq b' \wedge b'\models G$.

Plan:

für jeden nicht-Blatt-Teilbaum $T$ des Syntaxbaumes von $F$ eine zusätzliche Variable $n_T$ einführen,
so daß $\forall b'\in \operatorname{Mod}(G): \operatorname{val}(n_T,b') = \operatorname{val}(T,b)$.

Realisierung:

(Bsp.) $T=L \vee R$, dann $n_T \leftrightarrow (n_L \vee n_R)$ als CNF
für jeden der $|F|$ Knoten: $\le 8$ Klauseln mit $3$ Literalen

Tseitin-Transf. für Schaltkreise

beschriebenes Verfahren funktioniert ebenso für Schaltkreise (azyklische gerichtete Graphen, mit Booleschen Operatoren markiert)
Schaltkreis entsteht aus Baum durch Identifikation (sharing) von Knoten
für jeden Knoten eine neue Variable angelegen und deren Wert lokal durch eine CNF bestimmen
Ersatz realisiert observable sharing durch Adress-Vergleich von Syntaxbaumknoten (des Typs Bit)
```
-- (a || b) wird nur einmal T-transformiert:
let { s = a || b } in  s && (c === s) 
```

Tseitin-Transformation in Ersatz (Bsp)

so ausprobieren:

ghci> :set -XTypeApplications 
ghci> runSAT' $ do
  x <- exists; y <- exists @Bit; assert (x === y)
((),SAT 4 ((1) & (-4 | -3 | -2) & (-4 | 2 | 3)
   & (-2 | 3 | 4) & (-3 | 2 | 4) & (-4)) mempty)

Aufgabe: damit observable sharing bestätigen
Aufgabe: CNF zu assert (x /== (y /== z)) (XOR)

Abmessungen von Schaltkreisen

(die Frage ist nicht, ob AMD Epyc in SP5-Sockel paßt)
Def. Schaltkreis (circuit): gerichteter kreisfreier markierter Graph, als symbolische Repräsent. einer Booleschen Fkt.
Def. Abmessung (complexity):
- Def. Größe (size): Anzahl der Knoten
  - bei Hardware: Material-Aufwand
  - für SAT-Kodierung: (nach Tseitin-T.) Größe der CNF
- Def. Tiefe (depth): Länge eines längsten Pfades
  - bei (paralleler!) Hardware: Rechenzeit
  - bei SAT-Kodierung: Länge von Abhängigkeitsketten von (Hilfs)variablen, beeinflußt Solver-Laufzeit
Bsp: XOR $N$-stellig: $O(N)$ Größe, $O(\log(N))$ Tiefe

Abmessungen von Schaltkreisen: wozu?

SAT-Kodierung: man möchte immer die (Teil)Formel, für die der Solver am schnellsten die Erfüllbarkeit entscheiden kann
das läßt sich sehr schwer vorhersagen, abhängig von
- Lösungsverfahren auf Teilformeln
- nicht-lokale Kombination von Teil-Lösungen
betrachten stattdessen die Größe der Eingabe (CNF, Größen sind: Anzahl Variablen, Anzahl Klauseln)

in vielen Publikationen so durchgeführt (siehe AMO)
…stattdessen Größe eines Schaltkreises
- mit beschränktem Eingangsgrad (z. B. 2)
- unbeschränkt nur f. Disjunktion, Konjunktion

Tseitin-Transformation (Aufgaben)

für diese Formeln:
- $(x_1 \leftrightarrow x_2) \leftrightarrow (x_3 \leftrightarrow x_4)$
- Halb-Adder (2 Eingänge $x,y$, 2 Ausgänge $r,c$)
  
  $(r\leftrightarrow (\neg(x\leftrightarrow y))) \wedge (c \leftrightarrow (x\wedge y))$
- Full-Adder (3 Eingänge, 2 Ausgänge)
jeweils:
- führe die Tseitin-Transformation durch
- gibt es eine kleinere erfüllbarkeitsäquivalente CNF?
  
  (deren Modelle Erweiterungen der Original-Modelle sind)
data Bit hat weitere Konstruktoren (Xor, Mux).

Wo werden diese benutzt?

Helfen sie tatsächlich bei der Erzeugung kleiner CNFs?

Definition, Motivation

$\textsf{Count}_{\le k}(x_1,\ldots,x_n):= (\sum_i x_i) \le k$.
$\textsf{AMO}$ (at most one): $=\textsf{Count}_{\le 1}$, entspr. $\textsf{ALO}$, $\textsf{EXO}$
Schubfach-Constraint (als Testfall, erfüllbar gdw. $B\le H$)

$\bigwedge_{1\le i\le H} \textsf{AMO}(x_{ij}|1\le j \le B) \wedge \bigwedge _{1\le j\le B} \textsf{ALO}(x_{ij}|1\le i\le H)$
Schubfach für $B=H$: dann ist $x$ Permutationsmatrix,

repräsentiert Bijektion von $\{1,\dots,B\}$ auf sich
Anwend.: Rösselsprung, Hamiltonkreis in $G=(V,E)$

Pfad $p$ in $G$ als Bijektion von Indexmenge $\{1,\ldots,|V|\}$ in Knotenmenge $V$ mit $\bigwedge_i (p(i),p(i+1))\in E$.

SAT-Kodierung eines Rösselsprungs

let n = height * width; places = [0 .. n-1]

let decode p = divMod p width
    edge p q =
        let (px,py) = decode p; (qx,qy) = decode q
        in  5 == (px-qx)^2 + (py-qy)^2
    rotate (x:xs) = xs <> [x]

a <- replicateM n $ replicateM n $ exists @Bit
assert $ all exactly_one a
assert $ all exactly_one $ transpose a
assert $ flip all (zip a $ rotate a) $ \ (e, f) ->
  flip all places $ \ p ->  e!!p  ==>
    flip any (filter (edge p) places) (\ q -> f!!q)

SAT-Kodierungen von AMO (I)

naiv, quadratisch: $\textsf{AMO}(x_1,\ldots,x_n)= \bigwedge\{ \overline{x_i}\vee\overline{x_j} | 1\le i < j \le n\}$

${n \choose 2}$ Klauseln, keine zusätzlichen Variablen
linear: mit Kodierung $\textsf{enc}: x\mapsto(x_e,x_z)=(x\ge 1, x\ge 2)$:

$0\mapsto (0,0), 1\mapsto (1,0), 2, 3,\dots \mapsto (1,1)$

Addition: $(x_e,x_z)+_{\textsf{enc}}(y_e,y_z)=\dots$

so daß $\textsf{enc}(x+y)=\textsf{enc}(x)+_{\textsf{enc}}\textsf{enc}(y)$

$\textsf{AMO}(x_1,\ldots,x_n) =\texttt{let~} (s_e,s_z)=\sum_{\textsf{enc}} \textsf{enc}(x_i) \texttt{~in~} \dots$

das sind $2n$ Hilfsvariablen, aber bei assert (amo xs) werden $n$ davon eliminiert durch Vorverarbeitung oder UP

SAT-Kodierungen von AMO (II) - log

$\textsf{AMO}(x)=\exists h: (x_i \Rightarrow (i=h))$

$h$ binär repräsentiert mit $\log n$ Bits.
Bsp. $\textsf{AMO}(x_0,\dots,x_3)=\exists h_1,h_0: \begin{array}{cc} & (\overline x_0\vee \overline h_1)\wedge(\overline x_0 \vee \overline h_0) \\ \wedge & (\overline x_1\vee \overline h_1)\wedge(\overline x_1 \vee h_0) \\ \wedge & (\overline x_2\vee h_1)\wedge(\overline x_2 \vee \overline h_0) \\ \wedge & (\overline x_3\vee h_1)\wedge(\overline x_3 \vee h_0) \end{array}$
$n \log n$ Klauseln, $\log n$ zusätzliche Variablen
die Hilfsvariablen $h_0,h_1$ sind keine Funktionen der Eingangsvariablen.

(wenn alle $x_i$ falsch, dann $h_i$ beliebig)

SAT-Kodierungen von AMO (III) - sqrt

für $\textsf{AMO}(x)$: die $x$ in einem Rechteck anordnen,

$z_i:=\bigvee_j x_{ij}$ (Zeile $i$), $s_j:=\bigvee_i x_{ij}$ (Spalte $j$),

dann $\textsf{AMO}(x)=\textsf{AMO}(z)\wedge\textsf{AMO}(s)$.

Jingchao Chen: A New SAT Encoding of the At-Most-One Constraint 10th Workshop Constraint Modeling and Reformulation, 2010

https://www.it.uu.se/research/group/astra/ModRef10/programme.html
Formelgröße $f(n)=\Theta(n) + 2f(\sqrt n)$, mit $\Theta(\sqrt n)$ Hilfsvar.

Lineare Faktoren sind klein. Ü: wenn

assert (amo xs),

kann man einige Klauseln weglassen. Welche?

Aufgaben

Vergleiche Sie die commander-Kodierung für AMO von Klieber und Kwon, Int. Workshop Constraints in Formal Verification, 2007, mit Kodierungen aus dem Skript.

a) auf dem Papier, b) praktisch: mit ersatz implementieren, Formelgrößen messen, auch nach Vorverarbeitung durch minisat
Für die sqrt-Kodierung für AMO von Chen 2010:

Benutzen Sie die gleiche Idee für eine höherdimensionale Anordnung, z.B. AMO von 30 Variablen als $2 \times 3 \times 5$.

Teilen Sie AMO für $2^n$ Variablen in $2\times\dots\times 2$ ein und vergleichen Sie mit der log-Kodierung.
für die lineare AMO-Kodierung (Addition auf $\{0,1,\ge 2\}$):

untersuchen Sie den Unterschied zwischen der Verwendung von foldr und foldb
für jede der betrachteten AMO-Kodierungen: wie kann mit möglichst wenig Zusatz-Aufwand EXO erhalten?
Für den Rösselsprung:
- zusätzliches assert $ a !! 0 !! 0 diskutieren und ausprobieren
- AMO und ALO durch EXO ersetzen
- umbauen, so daß ein kreuzungsfreier Weg der Länge $=l$ (zusätzlicher Eingabe-Parameter) beschrieben wird.
- andere Kodierung für Hamiltonkreis: Neng-Fa Zhou: In Pursuit of an Efficient SAT Encoding for the Hamiltonian Cycle Problem, CP 2020, ModRef 2019, https://www.sci.brooklyn.cuny.edu/~zhou/
- Anwendung: George Jelliss: Leapers at Large, 2001, 2022 http://www.mayhematics.com/t/pl.htm
  
  Resultate zur Existenz von Hamilton-Pfaden (HP) und -Kreisen (HC) nachrechnen und ergänzen, Bsp.:
  - HP für Giraffe $(1,4)$ auf 11$\times$ 11?
    
    (Nein—unsat nach 6 Stunden)
  - HP für Zebra $(2,3)$ auf 13 $\times$ 13?
  - HP für Antilope $(3,4)$ auf 20 $\times$ 20?
  vgl. Donald Knuth: Leaper Graphs, 1994, https://arxiv.org/abs/math/9411240

Komplexität der Erfüllbarkeit

Motivation, Begriffe

Laufzeit-Komplexität eines Programms $P$

ist die Funktion $f$ mit $f(n)=$ die maximale Laufzeit von $P$ über alle Eingaben der Größe $\le n$.
solche Funktionen vergleicht man asymptotisch

(ignoriert Anfangswerte und konstante Faktoren)
Laufzeit-Komplexität einer Aufgabe $A$:

die minimale Komplexität aller Programme, die $A$ lösen
die Erfahrung lehrt: $\operatorname{\text{SAT}}\notin\textsf{P}$, das ist jedoch unbewiesen,

man konnte bisher nur zeigen: $\operatorname{\text{SAT}}$ ist NP-vollständig.

Wiederholung: NP-Vollständigkeit

nichtdeterministische Turingmaschine (NDTM)
- Rechnung ist eine Baum,
- jeder Knoten ist eine Konfiguration
  
  (Bandinhalt, Kopfzustand, Kopfposition),
- jede Kante ist ein Rechenschritt
- Rechnung ist erfolgreich, wenn in wenigstens einem Blatt der Zustand akzeptierend ist
NP $:=$ die Sprachen, die sich in Polynomialzeit durch NDTM entscheiden lassen
Reduktion $M\le_P L \iff \exists f: \forall x: x\in M \iff f(x)\in L$ und $f$ ist P-berechenbar
$L$ ist NP-vollständig: $L\in\operatorname{\text{NP}}$ und $\forall M\in\operatorname{\text{NP}}: M\le_P L$

Wiederholung: SAT ist NP-vollständig

$\operatorname{\text{SAT}}\in\operatorname{\text{NP}}$ ist klar (NDTM rät die Belegung)

Sei $M\in\operatorname{\text{NP}}$, zu zeigen $M\le_P \operatorname{\text{SAT}}$. Gegeben ist also das Programm einer NDTM, die $M$ in Polynomialzeit akzeptiert

übersetze eine Eingabe $x$ für diese Maschine in eine Formel $f(x)$ mit $x\in M\iff f(x)\in\operatorname{\text{SAT}}$:
benutzt Unbekannte $C(t,p,a) :\iff$ zur Zeit $t$ steht an Position $p$ das Zeichen $a$.
Klauseln legen fest:

für $t=0$ steht die Eingabe auf dem Band,

$\forall t:$ von $t$ nach $t+1$ richtig gerechnet (lt. Programm)

schließlich akzeptierender Zustand erreicht

Die Tseitin-Transformation

Def: $\operatorname{\text{SAT}}$ $=$ Erfüllbarkeit beliebiger aussagenlogischer Formeln (sogar: Schaltkreise)

Def: $3\operatorname{\text{CNFSAT}}$ $=$ …Formeln in konjunktiver NF mit 3 Literalen je Klausel
die Tseitin-Transformation beweist $\operatorname{\text{SAT}}\le_P 3\operatorname{\text{CNFSAT}}$

denn sie in erzeugt aus einer beliebigen Formel $F$

in Polynomialzeit

eine erfüllbarkeitsäquivalente Formel $G$ in 3-$\operatorname{\text{CNF}}$
vereinfacht den Beweis der NP-Vollständigkeit weiterer Aufgaben (z.B. Graphenfärbung) $\textsf{3COL}$.

zu zeigen ist: $\forall A \in \operatorname{\text{NP}}: A\le_P \textsf{3COL}$

man benutzt $A\le_P \operatorname{\text{SAT}}\le_P 3\operatorname{\text{CNFSAT}}\le_P \textsf{3COL}$.

Was nützen diese Aussagen?

1. sie beantworten die Frage: welche Aufgaben lassen sich SAT-kodieren: Aufgabe $A$ hat SAT-Kodierung mit polynomieller Formelgröße $\iff$ $A\in\operatorname{\text{NP}}$.
2. SAT ist NP-vollständig:

falls $\operatorname{\text{SAT}}\in P$ (es gibt einen SAT-Solver in Polynomialzeit) dann folgt $\operatorname{\text{NP}}\subseteq P$.

(jede NP-vollständige Aufgabe ließe sich durch SAT-Kodierung in Polynomialzeit lösen)

das ist unwahrscheinlich (nach jetzigem Kenntnisstand)
- für jedes bekannte SAT-Lösungsverfahren gibt es schwere Eingaben
- Verfahren sind trotzdem erstaunlich leistungsfähig

Spezifikation

Eingabe: eine Formel in CNF

,[-4,-3,11],[-11,3],[-11,4],[-11],[3,4,13],[-13,-3],[-13,-4],[-2,12,13],[-12,2],[-13,-12],[-12],[-7,-6,14],[-14,6],[-14,7],[-14],[6,7,16],[-16,-6],[-16,-7],[-5,15,16],[-15,5],[-16,-15],[-15],[-10,-9,17],[-17,9],[-17,10],[-17],[9,10,19],[-19,-9],[-19,-10],[-8,18,19],[-18,8],[-19,-18],[-18],[2,5,8,20],[-20,-2],[-20,-5],[-20,-8],[-20],[3,6,9,21],[-21,-3],[-21,-6],[-21,-9],[-21],[4,7,10,22],[-22,-4],[-22,-7],[-22,-10],[-22]]
Ausgabe:
- eine erfüllende Belegung
- oder ein Beweis für Nichterfüllbarkeit

Implementierung eines naiven SAT-Solvers

benutzt die Schnittstelle aus ersatz

minisat :: Solver SAT IO
type Solver s m
  = s -> m (Result, IntMap Bool)
data Result
  = Unsolved  | Unsatisfied | Satisfied
class DIMACS t where
  dimacsNumVariables :: t -> Int
  dimacsClauses :: t -> Seq IntSet
data SAT; instancs DIMACS Sat

Lösungsverfahren

vollständige Suche (alle Belegungen, vollst. Binärbaum)
unvollständige Suche (einige Belegungen)
- evolutionär (Genotyp $=$ Belegung)
- lokale Suche (Selman, Kautz, Cohen 1993: Walksat)
verbesserte vollständige Suche (Erkennen und Abschneiden sinnloser Teilbäume)

DPLL (Davis, Putnam, Logeman, Loveland 1960/61)
weitere Verbesserungen durch
- Lernen (und Vergessen!) von zusätzlichen Klauseln
- Vorverarbeitung zum Entfernen von Variablen
- Parallelisierung
  
  (Kommunikation mehrerer Suchverfahren)

Evolutionäre Algorithmen für SAT

Genotyp: Bitfolge $[x_1, \ldots, x_n]$ fester Länge
Phänotyp: Belegung $b = \{ (v_1,x_1),\ldots,(v_n,x_n)\}$
Fitness: z. B. Anzahl der von $b$ erfüllten Klauseln
Operatoren:
- Mutation: einige Bits ändern
- Kreuzung: one/two-point crossover?
  
  Problem: starke Abhängigkeit von Variablenreihenfolge

Lokale Suche (GSat, Walksat)

Bart Selman, Cornell University,
Henry Kautz, University of Washington

https://web.archive.org/web/20070311005144/http://www.cs.rochester.edu/u/kautz/walksat/

Algorithmus:

beginne mit zufälliger Belegung
wiederhole: ändere das Bit, das die Fitness am stärksten erhöht

Problem: lokale Optima — Lösung: Mutationen.

DPLL

Davis, Putnam (1960), Logeman, Loveland (1962),

http://dx.doi.org/10.1145/321033.321034 http://dx.doi.org/10.1145/368273.368557

Zustand $=$ partielle Belegung

Decide: eine Variable belegen
Propagate: alle Schlußfolgerungen ziehen

Beispiel: Klausel $x_1\vee x_3$, partielle Belegung $x_1=0$,

Folgerung: $x_3=1$
bei Konflikt (widersprüchliche Folgerungen)
- (DPLL original) Backtrack (zu letztem Decide)
- (DPLL mit CDCL) Backjump (zu früherem Decide)

DPLL-Begriffe

für partielle Belegung $b$ (Bsp: $\{(x_1,1),(x_3,0)\}$): Klausel $c$ ist

erfüllt, falls $\exists l\in c: b(l)=1$, Bsp: $(\neg x_1\vee x_2\vee \neg x_3)$
Konflikt, falls $\forall l\in c: b(l)=0$, Bsp: $(\neg x_1\vee x_3)$
unit, falls $\exists l\in c: b(l)=\bot \wedge \forall l'\in (c\setminus\{l\}): b(l')=0$,

Bsp: $(\neg x_1 \vee \neg x_2 \vee x_3)$. Dabei ist $l=\neg x_2$ das Unit-Literal.
offen, sonst. Bsp: $(x_2\vee x_3\vee x_4)$.

Eigenschaften: für CNF $F$ und partielle Belegung $b$:

wenn $\exists c\in F$ : $c$ ist Konflikt für $b$, dann $\neg \exists b'\supseteq b$ mit $b'\models F$

(d.h., die Suche kann dort abgebrochen werden)
wenn $\exists c\in F$: $c$ ist Unit für $b$ mit Literal $l$, dann $\forall b'\supseteq b: b'\models F \Rightarrow b'(l)=1$

(d.h., $l$ kann ohne Suche belegt werden)

DPLL-Algorithmus

Eingabe: CNF $F$,
Ausgabe: Belegung $b$ mit $b\models F$ oder UNSAT.

$\operatorname{DPLL}(b)$ (verwendet Keller für Entscheidungspunkte):

(success) falls $b\models F$, dann halt (SAT), Ausgabe $b$.
(backtrack) falls $F$ eine $b$-Konfliktklausel enthält, dann:
- falls Keller leer, dann halt (UNSAT)
- sonst $v := pop()$ und $\operatorname{DPLL}(b_{<v} \cup \{(v,1)\}$.
dabei ist $b_{<v}$ die Belegung vor decide$(v)$
(propagate) falls $F$ eine $b$-Unitklausel $c$ mit Unit-Literal $l$ enthält: $\operatorname{DPLL}(b\cup\{(\text{variable}(l),\text{polarity}(l))\})$.
(decide) sonst wähle $v\notin\operatorname{dom}b$, push$(v)$, und $\operatorname{DPLL}(b\cup\{(v,0)\})$.

DPLL: Eigenschaften

Termination: DPLL hält auf jeder Eingabe
Korrektheit: wenn DPLL mit SAT hält, dann $b\models F$.
Vollständigkeit: wenn DPLL: UNSAT, dann $\neg\exists b: b\models F$

wird bewiesen durch Invariante

$\forall b': b'\in\operatorname{Mod}(F) \Rightarrow b\le_\text{lex}b'$

(wenn DPLL derzeit $b$ betrachtet, und wenn $F$ ein Modell $b'$ besitzt, dann ist $b'$ unterhalb oder rechts von $b$)
dabei bedeutet: $b\le_\text{lex}b'$:

$b\subseteq b'$ oder $\exists v: b(v)=0 \wedge (b_{<v}\cup\{(v,1)\})\subseteq b'$

Satz (Ü): für alle endlichen $V$: $<_\text{lex}$ ist eine wohlfundierte Relation auf der Menge der partiellen $V$-Belegungen:

DPLL-Beispiel

[[2,3],[3,5],[-3,-4],[2,-3,-4]
,[-3,4],[1,-2,-4,-5],[1,-2,4,-5]]

decide belegt immer die kleinste freie Variable, immer zunächst negativ

DPLL-Beispiel (Lösung)

[[2,3],[3,5],[-3,-4],[2,-3,-4]
,[-3,4],[1,-2,-4,-5],[1,-2,4,-5]]

[Dec (-1),Dec (-2),Prop 3,Prop (-4),Back
,Dec 2,Dec (-3),Prop 5,Prop (-4),Back
,Dec 3,Prop (-4),Back,Back,Back
,Dec 1,Dec (-2),Prop 3,Prop (-4),Back
,Dec 2,Dec (-3),Prop 5]

DPLL: Implement., Heuristik, Ergänzungen

Grundlage ist effiziente Impl. von UP und Konflikt-Erkennung
Methoden:
- Wahl der nächsten Entscheidungsvariablen
  
  (kommt am häufigsten in aktuellen Konflikten vor)
- Lernen von Konflikt-Klauseln (erlaubt Backjump)
- Vorverarbeitung (Variablen und Klauseln eliminieren)
alles vorbildlich implementiert und dokumentiert in Minisat http://minisat.se/ (Niklas Een, Niklas Sorenson) (seit ca. 2005 sehr starker Solver)

später übernimmt diese Rolle: Cadical, Kissat https://fmv.jku.at/kissat/ (Armin Biere)

Aufgaben

Geben Sie eine erfüllbare CNF an, für die monotone lokale Suche
```
improve n cnf b0 = ...
      let b1 = S.insert (negate l) $ S.delete l b0
      if badness cnf b1 <= badness cnf b0
        then improve n cnf b1
        else improve n cnf b0
```
nicht funktioniert: es gibt eine Belegung $b_0$, von der aus keine zulässige Schrittfolge zu einer erfüllenden Belegung führt. Hinweis: z.B., weil es überhaupt keine erlaubten Schritte gibt.

Wie behandeln gsat/walksat diesen Fall?
wenden Sie den SAT-Solver mit lokaler Suche auf realistische CNFs an, z.B. aus Kodierung Rösselsprung.
wie werden in minisat (kissat, …) Einheits- und Konfliktklauseln erkannt? (Hinweis: two watched literals)
unit propagation (UP) implementieren:
- Einheitsklauseln erkennen:
```
type Literal = Int
units :: CNF -> [Literal]
units [[1,2],[-3],[3,4]] = [-3]
```
- ein Literal belegen:
```
assign :: Literal -> CNF -> CNF
assign (-3) [[1,2],[-3],[3,4]] = [[1,2],[4]]
```
Wo stehen die entsprechenden Funktionen im Quelltext der Autotool-Aufgabe zu DPLL?

SAT-Solver (fortgeschrittene Techniken)

Plan

bisher:
- (unvollst.) stochastische lokale Suche (gsat, walksat)
- vollständige Suche (DPLL)
jetzt und folgend:
- DPLL beschleunigen durch Klausel-Lernen (CDCL)
- (jedes Verfahren) beschleunigen durch Vorverarbeitung (preprocessing): Variablen-Elimination
- Verifikation von UNSAT-Beweisen
- gemeinsame Grundlage: Resolution

Semantisches Folgern

Def: eine Formel $F$ folgt aus einer Formelmenge $M$, geschrieben $M\models F$, falls $\operatorname{Mod}(M)\subseteq\operatorname{Mod}(F)$.
Bsp: $\{x_1\vee\overline x_2,x_2\vee x_3\}\models (x_1\vee x_3)$,
Beweise (lt. Def.) z.B. durch Vergleich der Wertetabellen
(d.h., explizites Aufzählen der Modellmengen)

Eigenschaften (Übungsaufgaben):

$M \models \mathsf{True}$
$(M\models \mathsf{False}) \iff (\operatorname{Mod}(M)=\emptyset)$
$(M\models F) \iff (\operatorname{Mod}(M\cup\{\neg F\})=\emptyset)$
wird bei CDCL benutzt: wir lernen nur Klauseln $F$,
die aus der CNF (Klauselmenge) $M$ folgen:

$(M\models F) \iff (\operatorname{Mod}(M)=\operatorname{Mod}(M\cup\{F\}))$

Resolution

Definition: für Literal $l$ : die Resolvente $\operatorname{\textsf{Res}}_l(c,d)$

der Klausel $c$ mit $l \in c$, und der Klausel $d$ mit $\neg l\in d$:

ist die Klausel $(c\setminus \{l\}) \cup (d\setminus\{\neg l\})$.
Bsp. $l=\overline {x_2}, c=(x_1\vee \overline{x_2}), d=(x_2\vee x_3)$,

$\operatorname{\textsf{Res}}_l(c,d) = (x_1\vee x_3)$.
Satz: $\{c,d\}\models \operatorname{\textsf{Res}}_l(c,d)$.
Beweis: für jede Belegung $b\in \operatorname{Mod}({c,d})$:

vollst. Fallunterscheidung: $b(l)=0$ oder $b(l)=1$.
Anwendung: Hinzufügen einer Resolvente ändert die Modellmenge nicht, kann Propagationen ermöglichen

DPLL mit CDCL (Plan)

conflict driven clause learning –

bei jedem Konflikt eine Klausel $C$ hinzufügen, die

aus der Formel folgt (d.h. Modellmenge nicht ändert)
den Konflikt durch Propagation verhindert

Eigenschaften/Anwendung:

danach backjump zur vorletzten Variable in $C$.

(die letzte Variable wird dann propagiert, das ergibt die richtige Fortsetzung der Suche)
$C$ führt hoffentlich auch später zu Propagationen, d.h. Verkürzung der Suche
…wenn nicht: gelernte Klauseln kann man auch vergessen

Naives Lernen

jede partielle Belegung $b$ mit $\operatorname{dom}(b)=\{v_1,\dots,v_k\}$

entspricht einer Konjunktion

$B = (v_1\leftrightarrow b(v_1))\wedge \dots\wedge (v_k\leftrightarrow b(v_k))$
beim Lösen der Formel (Klauselmenge) $F$:
Konflikt bei partieller Belegung $b$:

man kann $C=\neg B =(\neg (v_1\leftrightarrow b(v_1))\vee\dots\vee \neg(v_k \leftrightarrow b(v_k))$ lernen

Beweis: zu zeigen ist $F\models C$, folgt aus $\operatorname{Mod}(F\cup \{B\})=\emptyset$
…sollte man aber nicht, denn $C$ ist mglw. zu groß (enthält Literale, die am Konflikt gar nicht beteiligt sind)

Lernen (Implementierung) und Backjump

benutze (resolviere) Klauseln, die seit der letzten Entscheidung für Propagationen verwendet wurden.

c := Konflikt-Klausel // für aktuelle Bel. b
while (...) { // inv: für alle l' in c: b(l')=0
  l := das in c zuletzt belegte Literal
  d := Unit-Klausel, durch die var(l) belegt wurde
  c := resolve_l (c,d); }

diese Resolution ist immer möglich, denn es gilt

$b(l)=0,l\in c$ (ist Konflikt), $b(\overline{l})=1, \overline{l}\in d$ (ist Unit)

Schleife verlassen (und $c$ lernen), wenn $c$ nur noch ein Literal $l_h$ der aktuellen Entscheidungstiefe enthält.
dann Backjump zu nächst-höherer Entscheidung in $c$.

von dort wird $l_h$ unit-propagiert.

Aufgaben

(Knuth Aufgabe 254) Für $\{ 12, \overline{1} 3, 2\overline{3},\overline{2}\overline{4}, \overline{3}4\}$: nach der Entscheidung $1$: welche Klausel wird gelernt?

D. E. Knuth, TAOCP Vol. 4, Fasc. 6, Satisfiability, 2015.
Schleife verlassen, wenn $c$ nur noch ein Literal der aktuellen Entscheidungstiefe …:
1. wieso ist die Bedingung anfangs falsch? (es kann nicht sein, daß die originale Konflikt-Klausel $c$ gelernt wird)
2. wieso wird diese Bedingung wahr? (es kann nicht sein, daß es immer $\ge 2$ solche Literale sind oder plötzlich gar keines)
3. wieso wird immer eine Klausel gelernt, die bisher nicht zur Klauselmenge gehört?
(Knuth Aufgabe 378) blocked clause elimination:

Für Klauselmenge $F$: eine Klausel $C=(l \vee l_1\vee \dots\vee l_k)$

heißt blockiert durch Literal $l$,

falls für jede Klausel $D\in F$ mit $\overline{l}\in D$ gilt: $\exists i: \overline{l_i}\in D$.
1. ein Beispiel angeben.
2. beweisen: $F\setminus\{C\}$ erfüllbar $\Rightarrow$ $F$ erfüllbar.
3. ist jedes Modell $b$ von $F\setminus\{C\}$ auch ein Modell von $F$?
conflict clause minimization (Sörenson, SAT 2005, http://minisat.se/downloads/MiniSat_v1.13_short.pdf): Ein Beispiel angeben. Entsprechende Ergänzung der autotool-Aufgabe vorschlagen.
hier besprochene Heuristiken und Ergänzungen
- in den Protokollen von minisat, kissat wiederfinden
  
  (z.B. wieviele Klauseln werden gelernt? wie groß sind diese? wann vergessen?)
- durch Optionen von kissat an/abschalten

Weitere Anwendungen der Resolution

Überblick

Wiederholung Resolution
Anwendung (Wdhlg): Ableiten (Lernen) einer Klausel aus Konflikt-Klausel und UP-Klauseln
vollständige Resolution: zur Variablen-Elimination
- als Vorverarbeitungs-Schritt im Solver
- als vollständiges (aber im allg. unpraktisches) Entscheidungsverfahren für SAT
Ableitung der leeren Klausel als Beweis der Unerfüllbarkeit, Anwendung: Formate RUP und DRAT

Resolution

ein Resolutions-Schritt: \[\frac{(x_1 \vee \ldots \vee x_m \vee y), (\neg y \vee z_1 \vee \ldots \vee z_n)} {x_1 \vee \ldots \vee x_m \vee z_1 \vee \ldots \vee z_n}\]
Sprechweise: Klauseln $C_1,C_2$ werden nach $y$ resolviert.
Schreibweise: $C = C_1 \oplus_y C_2$, Beispiel: $\displaystyle \frac{x\vee y,\neg y\vee \neg z}{x\vee\neg z}$
Satz: $\{C_1,C_2\} \models C_1\oplus_y C_2$. (Resolvente folgt aus Prämissen.)
Ü: Unit-Progagation als Resolution auffassen: $u \oplus (\neg u\vee l_2\vee\dots) = (l_2\vee\dots)$

Variablen-Elimination durch vollst. Resolution

für Formel (Klauselmenge) $F$ und Variable $v$:

$\operatorname{\textsf{Pos}}_v(F) =\{c | c\in F, v\in c\}$; $\operatorname{\textsf{Neg}}_v(F) =\{c | c\in F, \neg v\in c\}$

$\operatorname{\textsf{Res}}_v(F)=\bigcup_{p\in\operatorname{\textsf{Pos}}_v(F),n\in\operatorname{\textsf{Neg}}_v(F)} \operatorname{\textsf{Res}}_v(p,n)$
Satz: $F$ ist erfüllbarkeitsäquivalent zu $G$

mit $G := F\setminus (\operatorname{\textsf{Pos}}_v(F)\cup \operatorname{\textsf{Neg}}_v(F))\cup \operatorname{\textsf{Res}}_v(F)$.
das (iteriert) ist ein vollständiges Lösungsverfahren!

aber unpraktisch, weil $|G|\gg |F|$ möglich ist:

$|G| = |F| - (|\operatorname{\textsf{Pos}}_v(F)| + |\operatorname{\textsf{Neg}}_v(F)|) + |\operatorname{\textsf{Pos}}_v(F)|\cdot |\operatorname{\textsf{Neg}}_v(F)|$.
Anwendung: für solche $v$, für die $|G|\le|F| + \Delta$
Quelle: Een und Biere: Effective Preprocessing …, SAT 2005,

http://minisat.se/downloads/SatELite.pdf

dort weitere Vorverarbeitungs-Verfahren

Resolution als Inferenzsystem

mehrere Schritte:

Schreibweise: $M\vdash C$
Klausel $C$ ist ableitbar aus Klauselmenge $M$
Definition:
- (Induktionsanfang) wenn $C\in M$, dann $M\vdash C$
- (Induktionsschrit)
  
  wenn $M\vdash C_1$ und $M\vdash C_2$, dann $M\vdash C_1\oplus_y C_2$

Beachte Unterschiede:

Ableitung $M\vdash C$ ist syntaktisch definiert (Term-Umformung)
Folgerung $M\models C$ ist semantisch definiert (Term-Auswertung)

Resolution und Unerfüllbarkeit

Satz: $\operatorname{Mod}(F)=\emptyset \iff F\vdash \emptyset$ (in Worten: $F$ in CNF nicht erfüllbar $\iff$ aus $F$ kann man die leere Klausel ableiten.)

Korrektheit ($\Leftarrow$): Übung.
Vollständigkeit ($\Rightarrow$): Induktion nach $|\operatorname{Var}(F)|$

dabei Induktionsschritt:

betrachte $F$ mit Variablen $\{x_1,\ldots,x_{n+1}\}$.
Konstruiere $F_0$ (bzw. $F_1$) aus $F$
durch Belegen von $x_{n+1}$ mit 0 (bzw. 1)

(d. h. Streichen von Literalen und Klauseln)
Zeige, daß $F_0$ und $F_1$ unerfüllbar sind.
wende Induktionsannahme an: $F_0\vdash\emptyset,F_1\vdash \emptyset$
kombiniere diese Ableitungen

Resolution, Bemerkungen

moderne SAT-Solver können Resolutions-Beweise für Unerfüllbarkeit ausgeben
es gibt nicht erfüllbare $F$ mit (exponentiell) großen Resolutionsbeweisen (sonst wäre NP $=$ co-NP, das glaubt niemand)
komprimiertes Format für solche Beweise (RUP—reverse unit propagation) wird bei “certified unsat track” der SAT-competitions verwendet (evtl. Übung)

Beweise für Nichterfüllbarkeit

bisher: Interesse an erfüllender Belegung $m\in\operatorname{Mod}(F)$ ($=$ Lösung einer Anwendungsaufgabe)
jetzt: Interesse an $\operatorname{Mod}(F)=\emptyset$.

Anwendungen: Schaltkreis $C$ erfüllt Spezifikation $S$ $\iff$ $\operatorname{Mod}(C(x) \neq S(x)) = \emptyset$.

Solver rechnet lange, evtl. Hardwarefehler usw.

$m\in\operatorname{Mod}(F)$ kann man leicht prüfen

(unabhängig von der Herleitung)
wie prüft man $\operatorname{Mod}(F)=\emptyset$?

(wie sieht ein Zertifikat dafür aus?)

Reverse Unit Propagation

http://www.satcompetition.org/2014/certunsat.shtml

RUP proofs are a sequence of clauses that are redundant with respect to the input formula. To check that a clause C is redundant, all literals C are assigned to false followed by unit propagation. In order to verify redundancy, unit propagation should result in a conflict.

$\curvearrowright$ Konflikt für $F\wedge \neg C$ $\curvearrowright$ $F\wedge\neg C$ ist nicht erfüllbar $\curvearrowright$ $\neg F\vee C$ ist allgemeingültig $\curvearrowright$ $F\models C$ (aus $F$ folgt $C$) $\curvearrowright$ $C$ ist redundant

siehe auch E.Goldberg, Y.Novikov. Verification of proofs of unsatisfiability for CNF formulas. Design, Automation and Test in Europe. 2003, March 3-7,pp.886-891 http://eigold.tripod.com/papers/proof_verif.pdf

Deletion Resolution Asymmetric Tautology

Nathan Wetzler, Marijn J.H. Heule and Warren A. Hunt: DRAT-trim: Efficient Checking and Trimming Using Expressive Clausal Proofs. SAT 2014

https://www.cs.utexas.edu/~marijn/drat-trim/
asymmetric literal addition: für CNF $F$, Klausel $C$: $\textsf{ALA}(F,C)$ ist der Fixpunkt der Operation:

wenn $\exists l_1,\ldots, l_k\in C, (l_1\vee\ldots\vee l_k\vee l)\in F$,
dann $C_{i+1}=C_i\cup \{\overline l\}$.
asymmetrische Tautologie: $\textsf{AT}_F(C) := (\textsf{ALA}(F,C)=1)$.

resolution AT:

$\textsf{RAT}_F(C):=\exists l\in C:\forall D\in F: (\overline l)\in D\Rightarrow \textsf{AT}((D\setminus\{\overline{l}\})\cup C)$

Satz: $C\notin F\wedge \textsf{RAT}_F(C) \Rightarrow F \equiv_{\text{SAT}} (F \cup \{C\})$

Übungen

WS23: empfohlen: 1, 2, 3, 5, 8

für unserer Microsat-Solver: Unit propagation und vollständige Elimination programmieren, testen, mit Vorverarbeitung von minisat usw. vergleichen.
Beispiele aus DRAT-Papier nachrechnen.

Wieso gilt the property AT is also known as RUP?

Den zitierten Satz $C\notin F\wedge \textsf{RAT}_F(C) \Rightarrow F \equiv_{\text{SAT}} (F \cup \{C\})$ beweisen.
von Cadical einen UNSAT-Beweis ausgeben lassen (für eine kleine CNF),

von Hand überprüfen, maschinell überprüfen ( https://github.com/marijnheule/drat-trim)
Die Werbung auf Webseite von drat-trim enthält: RAT …permits all known techniques including extended resolution, blocked clause addition, bounded variable addition, extended learning.

Geben Sie Quellen und (einfache) Beispiele für diese Techniken an. Besonders: bounded variable addition.
für eine Teilformel $F=F_1\wedge F_2$ wird die Tseitin-Transformation durchgeführt und für die dabei entstehende Variable $v_F$ (mit $v_f\leftrightarrow F$) ein assert.

Was passiert bei vollständiger Elimination von $v_F$?

(Es ist anzunehmen, daß das alle Solver tun. Deswegen ist für ersatz wohl keine Plaisted-Greenbaum-Transformation (J. Symb. Comp. 2(3) 1986, pp 293-304) https://doi.org/10.1016/S0747-7171(86)80028-1 notwendig.)
Wenn $G$ aus $F$ durch vollständige Resolution (Elimination) von $v$ entsteht: Konstruieren Sie aus einem Modell $b$ für $G$ ein Modell für $F$ (wie ist $v$ zu belegen?)
für eine unerfüllbare Schubfachschluß-Formel (in jeder Zeile $1, \dots, H$ höchstens einer wahr, in jeder Spalte $1, \dots, B$ wenigstens einer wahr, z.B. für $B=3,H=2$ die Klauselmenge $\{\overline 1\overline 2,\overline 1\overline 3,\overline 3\overline 3, \overline 4\overline 5,\overline 4\overline 6,\overline 5\overline 6, 12, 34, 56 \}$

einen möglichst kurzen Beweis der Unerfüllbarkeit
1. mit DPLL (ohne Lernen)
2. mit DPLL und CDCL
3. …und vorheriger Variablen-Elimination
4. …nur mit Variablen-Elimination (ohne DPLL)
Geben Sie ein Polynomialzeit-Entscheidungsverfahren für 2SAT (in der CNF hat jede Klausel $\le$ 2 Literale) an.

Sind die Lösungsverfahren (DPLL, DPLL $+$ CDCL, Variablen-Elimination) für 2SAT polynomiell? (Wenn ja, Beweis; wenn nein, geben Sie eine Familie von nicht erfüllbare 2SAT-Formeln an, für welche die Verfahren lange rechnen)
ich denke, die Giraffe (der $(1,4)$-Springer) hat keinen Hamiltonpfad auf $11\times 11$, siehe https://www.imn.htwk-leipzig.de/~waldmann/sat/leaper/. Nachrechnen und schön aufschreiben: Bachelorarbeit.

Definition, Motivation, Beispiel

Def: unbekanntes Element einer endlichen Menge $M$ repräsentieren als Folge (Struktur) von Bit,

(wenigstens $\lceil\log_2|M|\rceil$ viele, damit jedes $x\in M$ darstellbar ist)

ggf. zusätzliche Konsistenz-Bedingungen (nicht jede Bitfolge ist gültig)

Operationen und Relationen auf $M$ als aussagenlog. Formeln (Schaltungen) realisieren
Motivation: Constraints über $M$ durch SAT-Solver lösen
Bsp (Wdhlg): Hamiltonpfad/Kreis: kodiert Zahlen für Zeit und Ort als charakteristischen Vektor (one-hot)

One-Hot-Kodierung mit Ersatz

Datentyp: data OH = OH [Bit]

eine Unbekannte (mit Bereich $\{0, \dots, w\}$) anlegen:

make w = do
  bs <- replicateM (w+1) $ exists @Bit
  assert $ Ersatz.Counting.exactly 1 bs
  return $ OH bs

Beziehung zwischen symbolischen und konkreten Daten:

instance Codec OH where
  type Decoded OH = Natural
  decode s (OH bs) = do vs <- decode s bs
    return $ genericLength $ takeWhile not vs

one-hot-Kodierung

SAT-Kodierung von $\mathsf{Exactly}_1$ ist entscheidend

und deswegen ausführlich untersucht,
Übersicht in: Hölldobler, Van Hau Nguyen:

http://www.wv.inf.tu-dresden.de/Publications/2013/report-13-04.pdf,

vgl.

https://github.com/Z3Prover/z3/issues/755
Funktion, Relation $\Rightarrow$ Wertetabelle, Beispiel:

$f(a,b)=c$ wird zu $\bigwedge_{i,j} (a_i\wedge b_j)\Rightarrow c_{f(i,j)}$
Ü: Relation $<$ (kleiner als)?
Ü: partielle Funktion? z.B. Addition auf $\{0,\ldots,n-1\}$
(partielle) Funktion $D^k \to W$ benötigt $|D|^k$ Klauseln

nur für kleine Bereiche, geringe Stelligkeiten praktikabel

One-Hot-Arithmetik (variable Bitbreite)

instance Equatable OH where
  OH xs === OH ys =
    let common = min (length xs) (length ys)
    in  take common xs === take common ys

variable Bitbreite:

instance Num OH where
  OH xs + OH ys = OH $
    flip map [0 .. length xs + length ys] $ \ s ->
      or $ do -- nicht effizient!
        (i,x) <- zip [0..] xs
        (j,y) <- zip [0..] ys
        guard $ i + j == s
        return $ x && y

Feste (statische) Bitbreite: Zahlen auf Typ-Ebene

{-# language DataKinds #-} import GHC.TypeLits
data OH (w :: Nat) = OH [Bit]  -- Bitbreite im Typ

Allokation in Ersatz (allgemein)

class Variable t where
  literally :: MonadSAT s m => m Literal -> m t 
exists :: (Variable a, MonadSAT s m) => m a

Allokation für OH w, dabei Typ-Zahl $\Rightarrow$ Daten-Zahl

instance KnownNat w => Variable (OH w) where
  literally l = 
    .. replicateM (natVal (Proxy @w)) l ..

danach kann man schreiben exists @(OH 3)

Reflektion von Zahlen als Typ-Zahlen

bisher: Zahlen im Typ, Umwandlung zu Daten-Zahlen.

wir brauchen: die andere Richtung. Bsp: Zahl (Bitbreite) wird im Programm geändert oder ist Benutzer-Eingabe.
Lösung: Paket reflection, enthält Funktion
```
import Data.Reflection
reifyNat :: Integer
 ->(forall (n::Nat).KnownNat n => Proxy n -> r)->r
```
n ist lokal quantifiziert, kann nicht in r verwendet werden

Anw.: Typvar. n deklariert und mit Wert von x belegt

reifyNat (x :: Integer) $ \ (_ :: Proxy n) -> 
  do ..  exists @(OH n) ..

Treppen-Kodierung (order encoding)

Definition: $\forall i: b_i \iff (i\le u)$

Bsp: $u=2$ kodiert durch $b_0=1, b_1=1, b_2=1, b_3=0$
Constraints: $\forall i: b_i \Leftarrow b_{i+1}$ (Monotonie)
Ü: einfache (lineare) Kodierung von $\leq$

das erfordert nur linear große Formel

Ü: ist das trotzdem forcierend?
vergleiche: $\leq$ ist quadratisch für One-Hot.

Ü: lineare Übersetzung $f$ von One-Hot nach Treppe, dann $f(x)\le f(y)$ insgesamt linear für One-Hot $x,y$.

Addition für Treppenkodierung

(für variable Bitbreite) Addition genau wie für one-hot:

OH xs + OH ys = OH $
  flip map [0 .. length xs + length ys] $ \ s ->
    or $ do -- nicht effizient! (kubische Zeit)
      (i,x) <- zip [0..] xs
      (j,y) <- zip [0..] ys
      guard $ i + j == s  -- NICHT geändert!
      return $ x && y

Formelgröße: quadratisch. Ü: ist forcierend?

effizientere Kodierung ($O(n\log n)$) der Addition über Merge-Netze: Een, Sorenson: Translating Pseudo-Boolean Constraints into SAT, 2007.

http://minisat.se/downloads/MiniSat+.pdf

Binär-Kodierung, Addition

in Ersatz: data Bits = Bits [Bit], beginnt mit LSB!

Ordnung (Ü: fehlende Fälle in eq, Ü: Orderable)

instance Equatable Bits where
  Bits xs === Bits ys = eq xs ys where
    eq [] [] = true
    eq (x:xs) (y:ys) = (x === y) && eq xs ys

Addition (Ü: fehlende Fälle in add) Formelgröße linear

instance Num Bits where
  Bits xs + Bits ys = Bits $ add false xs ys where
    add cin (x:xs) (y:ys) =
      let (s,cout) = fullAdder cin x y
      in  s : add cout xs ys

Binäre Multiplikation

$[x_0,\ldots]_2 \cdot [y_0,\ldots]_2=[z_0,\ldots]_2$,

Schulmethode: $z=\sum 2^i \cdot x_i \cdot y$ (sequentielle Summation)
Verbesserungen: C.S. Wallace (1964), L. Dadda (1965),

benutze full-adder für verschränkte Summation,

(ähnlich zu carry-save-adder)

verringert Anzahl der Gatter und Tiefe des Schaltkreises

vgl. Townsend et al.:A Comparison of…, 2003

http://www.cerc.utexas.edu/~whitney/pdfs/spie03.pdf,
scheint für CNF-Kodierung wenig zu helfen

Testfall: Faktorisierung.

Arithmetik für (statisch) fixierte Bitbreite

data Bin (w::Nat) = Bin [Bit]

Gibt es instance Num (Bin 3)? Nein: $5+7 \notin$ Bin 3
relationale Kodierung (Summe raten und überprüfen mit plus_ok :: Bin w -> Bin w -> Bin w -> Bit)
funktionale Kodierung mit Überlauf
```
data Bin (w::Nat)
  = Bin { contents::[Bit], overflow::Bit }
```
- Überlauf richtig erzeugen (für Addition trivial, Ü: Multiplikation)
- Überlauf propagieren (aus den Argumenten für plus bzw. mal)
- Überlauf bei Implementierung von ===, <? beachten

Anwendung: Anzahl-Constraints

wir kennen: at-most-one
wir wünschen: at-most-$k$
(jetzt) triviale Lösung: die Bits binär addieren (aber in der passenden Klammerung!)

so realisiert in Ersatz.Counting
geht das besser? ($\Rightarrow$ Bachelorarbeit (wenigstens))

Praktische Eigenschaften von Kodierungen (I)

für CNF $F$ auf Variablen $V=\{v_1,\ldots,v_n\}$:

Definition: $F$ erkennt Widersprüche durch UP (unit prop.):

für jede partielle Belegung $b$ gilt:

wenn keine vollst. Belegung $b'\supseteq b$ existiert mit $b'\models F$,

dann führt UP auf $F$ von $b$ aus zu einem Konflikt
Bsp: $F=\{123,\overline 1\overline 2, 1\overline 2 \overline 3, 2 \overline 3, \overline 2 3\}$, $b=\{\overline 1\}$.
Ü: gilt diese Eigenschaft für die log-Kodierung von $\textsf{AMO}$?

Zu betrachten ist eine Belegung $b=\{(x_i,1),(x_j,1)\}$.

Wird durch UP ein Konflikt erreicht?

Praktische Eigensch. (II) – Forcing

für CNF $F$ auf Variablen $V=\{v_1,\ldots,v_n\}$ und Hilfsvariablen $H$:

Def.: $F$ ist (generalized) arc-consistent (GAC) (forcing):

für jede partielle Belegung $b$ mit $\operatorname{dom}b\subseteq V$

und jedes $v\in V$ mit $v\notin\operatorname{dom}b$:

wenn $v$ in allen Modellen $b'\supseteq b$ von $F$ den gleichen Wert hat, dann folgt dieser Wert bereits durch UP.
Bsp: log-Kodierung von $\textsf{AMO}(x)$: Betrachte $b = \{(x_i,1)\}$.

Alle anderen $x_j$ müssen dann falsch sein.

Wird das durch UP erreicht?

Aufgaben

Ist die Kodierung des Halb-Addierers $\textsf{HA}(x,y;c,r)$ durch $(r\leftrightarrow x \oplus y) \wedge (c \leftrightarrow x\wedge y)$ (Tseitin-Kodierung ohne weitere Hilfsvariablen) forcing?

Ist die Kodierung des Voll-Addierers $\textsf{FA}(x,y,z;c,r)$ durch $\textsf{HA}(x,y;c_1,r_1)\wedge\textsf{HA}(r_1,z;c_2,r)\wedge (c\leftrightarrow c_1\vee c_2)$ forcing?

Desgl. für die Kodierung von $\textsf{ITE}(i,t,e;x)$ (if-then-else) durch $(i\wedge t\rightarrow x)\wedge (i\wedge \overline t\rightarrow \overline x) \wedge (\overline i\wedge e\rightarrow x)\wedge (\overline i\wedge \overline e\rightarrow \overline x)$

Lesen Sie dazu auch Een und Sörenson: Translating Pseudo-Boolean Constraints into SAT, JSAT 2006, (http://minisat.se/Papers.html) Abschnitt 5.1.

Vergleichen Sie mit den Quelltexten von ersatz.

Aufgaben

Überprüfen Sie generalized arc-consistency (forcing) für sym_diff_eq a b c (Semantik: $|a-b|=c$) für One-Hot-Kodierung.

Bsp.: Bitbreite 4 (für Bereich $\{0, 1, 2, 3\}$), partielle Belegung $a_0=0, a_1=0, b_0=0, b_1=0$. Welche $c_i$ sind dadurch (semantisch) bestimmt? Erhält man diese durch Unit-Propagation? (nehmen Sie dabei an, daß die verwendete Kodierung von exactly-one forcierend ist).
zu D. E. Knuth: TAOCP Fasc. 7A (Version 18. Nov. 2022), S. 16 ff: Graph labeling

Diskutieren/realisieren Sie Bitblasting (SAT-Kodierung) für das reverse model (S. 19)

Aufgaben

sind angegeben Implementierungen der binären Arithmetik und Vergleichsrel. fixierter Breite forcierend?
Binärzahlen (statt one-hot) für Graceful labeling.
Kodierung von vorzeichenbehafteten Zahlen
1. feste Bitbreite: im Zweierkomplement
2. variable Bitbreite: zur Basis -2, Bsp. $-5 = 1 -2 +4 -8= 1\cdot (-2)^0 + 1\cdot(-2)^1 + 1\cdot(-2)^3 + 1\cdot(-2)^3$
  
  Instanzen für Ersatz (Codec, Equatable, Orderable, Num)
Diskutieren Sie richtige Propagation von Überläufen bei Kodierung von Zahlen aus $\{-B, \dots, B\}$ für Operationen plus, mal, kleiner, gleich.
weitere Beispiele und Aufgaben zu Bitblasting-Arithmetik:

https://www.imn.htwk-leipzig.de/~waldmann/talk/22/isr/#solving-qf_nia-by-bit-blasting

(ISR 2022)
Realisieren Sie die Berechnung des Überlaufs bei
1. Addition
2. Multiplikation
in QF_BV durch möglichst kleine Formel.

Damit können Sie ein Constraint $P$ in QF_NIA, QF_LIA in Constraints $P_w$ in QF_BV (mit Bitbreite $w$) übersetzen, und evtl. Glück haben, wie in VL beschrieben.

Probieren Sie für einfache (handgeschriebene) Constraints $P$ aus, ob (z.B. Z3) für $P$ oder $P_1, P_2, \dots$ schneller ist.

Plan

(für den Rest der Vorlesung)

Prädikatenlogik (Syntax, Semantik)
existentielle konjunktive Constraints

in verschiedenen Bereichen, z. B.

Gleichungen und Ungleichungen auf Zahlen $(\mathbb{Z},\mathbb{Q},\mathbb{R})$
beliebige Boolesche Verknüpfungen

SAT modulo $T$ ($=$ SMT), DPLL($T$)
Bit-blasting (SMT $\to$ SAT)

Syntax der Prädikatenlogik

Signatur: Name und Stelligkeit für
- Funktions-
- und Relationssymbole
Term:
- Funktionssymbol mit Argumenten (Terme)
- Variable
Formel
- atomar: Relationssymbol mit Argumenten (Terme)
- Boolesche Verknüpfungen (von Formeln)
- Quantor Variable Formel
- gebundenes und freies Vorkommen von Variablen
- Sätze ($=$ geschlossene Formeln)

Semantik der Prädikatenlogik

Universum, Funktion, Relation,
Struktur, die zu einer Signatur paßt
Belegung, Interpretation
Wert
- eines Terms
- einer Formel
in einer Struktur, unter einer Belegung

die Modell-Relation $(S,b) \models F$ sowie $S\models F$

Erfüllbarkeit, Allgemeingültigkeit (Def, Bsp)

Theorien

Def: $\operatorname{Th}(S) := \{ F \mid S \models F \}$

(Die Theorie einer Struktur $S$ ist die Menge der Sätze, die in $S$ wahr sind.)

Bsp: $\glqq \forall x:\forall y: x\cdot y=y\cdot x\grqq \in\operatorname{Th}(\mathbb{N},1,\cdot)$

Für $K$ eine Menge von Strukturen:

Def: $\operatorname{Th}(K) := \bigcap_{S\in K} \operatorname{Th}(S)$

(die Sätze, die in jeder Struktur aus $K$ wahr sind)

Bsp: $\glqq \forall x:\forall y: x\cdot y=y\cdot x\grqq \notin \operatorname{Th}(\text{Gruppen})$

…denn es gibt nicht kommutative Gruppen, z.B. $\operatorname{SL}(2,\mathbb{Z})$

Unentscheidbarkeit

(Alonzo Church 1938, Alan Turing 1937)

Das folgende Problem ist nicht entscheidbar:
- Eingabe: eine PL-Formel $F$
- Ausgabe: Ja, gdw. $F$ allgemeingültig ist.
Beweis: kodiert das Halteproblem für ein universelles Berechnungsmodell als eine Wahrheitsproblem der PL

Rechnung einer Turingmaschine kodiert durch 2-stellige Funktion $f(i,t)=$ der Inhalt von Zelle $i$ zur Zeit $t$.
diese mathematische Fragestellung (von David Hilbert, 1928) begründet die Wissenschaft der Informatik.

(die Berechenbarkeits-Theorie)

Folgerungen aus Unentscheidbarkeit

Suche nach (effizienten) Algorithmen für Spezialfälle

(die trotzdem ausreichen, um interessante Anwendungsprobleme zu modellieren)

Einschränkung der Signatur (Bsp: keine F.-S., nur einstellige F.-S, nur einstellige Rel.-S.)
Einschränkung der Formelsyntax
- nur bestimmte Quantoren, nur an bestimmten Stellen
  
  (im einfachsten Fall: ganz außen existentiell)
- nur bestimmte Verknüpfungen (Bsp: nur durch $\wedge$)
Einschränkung auf Theorien von gegebenen Strukturen

Bsp: $F\in\operatorname{Th}(\mathbb{N},0,+)$? $G\in\operatorname{Th}(\textsf{Gruppen})$

Lineare Gleichungen und Ungleichungen

Beispiel LP: monotone Interpretation

Beispiel: das Wortersetzungssystem $R=\{aa\to bbb, bb\to a\}$ terminiert.
Beweis: definiere $h: \Sigma\to\mathbb{N}: a\mapsto 5, b\mapsto 3$

und setze fort zu $h^* : \Sigma^* \to \mathbb{N}: h(c_1\ldots c_n)=\sum h(c_i)$.

Dann gilt $u \to_R v\Rightarrow h^*(u)>h^*(v)$ wegen $\forall (l\to r)\in R: h^*(l)>h^*(r)$.
Die Gewichtsfunktion $h$ erhalt man als Lösung des linearen Ungleichungssystems

$2a > 3b \wedge 2b > a \wedge a\ge 0 \wedge b\ge 0$.

Beispiel LP-Solver

Aufgabenstellung im LP-Format (http://lpsolve.sourceforge.net/5.0/CPLEX-format.htm)
```
Minimize
 obj: a + b
Subject To
 c1: 2 a - 3 b >= 1
 c2: 2 b -   a >= 1
End
```
lösen mit glpsol (GNU Linear Programing Kit, https://www.gnu.org/software/glpk/, 2000-2020, Andrew Makhorin)
```
glpsol --lp lin/lpex.cplex
```

Syntax, Semantik

lin. (Un-)Gleichungssystem $\to$ $\bigwedge_{i=1}^n$ Constraint
Constraint $\to$ Ausdruck Relsym Ausdruck
Relsym $\to ~=~ \mid ~ \le ~ \mid ~ \ge$
Ausdruck $\to$ Zahl $+ \sum_{i=1}^n$ (Zahl $\cdot$ Unbekannte)
Zahlenbereich: $\mathbb{Q}$ (rational)

Beispiel: $4y \le x \wedge 4x\le y-3 \wedge x+y \ge 1 \wedge x-y \ge 2$

Semantik: Wertebereich für Unbekannte ist $\mathbb{Q}$ (äquiv: $\mathbb{R}$)

Normalformen

Beispiel:

$4y \le x \wedge 4x\le y-3 \wedge x+y \ge 1 \wedge x-y \ge 2$
Normalform: $\bigwedge_i \sum_j a_{i,j} x_j \ge b_i$ \[\begin{aligned} x - 4y &\ge& 0 \\ \dots \end{aligned}\]
Matrixform: $A x^T \ge b^T$

$A$ ist linearer Operator.

Lösung von linearen (Un-)Gl.-Sys. mit Methoden der linearen Algebra

Hintergründe

Warum funktioniert das alles?

lineares Gleichungssystem:

Lösungsmenge ist (verschobener) Unterraum, endliche Dimension
lineares Ungleichungssystem:

Lösungsmenge ist Simplex (Durchschnitt von Halbräumen, konvex), endlich viele Seitenflächen

Wann funktioniert es nicht mehr?

nicht linear: keine Ebenen
nicht rational, sondern ganzzahlig: Lücken

Lineare Gleichungssysteme

Lösung nach Gauß-Verfahren:

eine Gleichung nach einer Variablen umstellen,

diese Variable aus den anderen Gleichungen eliminieren ($=$ Dimension des Lösungsraumes verkleinern)
Ü: es gibt kein solches Verfahren für CNF-SAT (es gibt keine Operation, die der Subtraktion entspricht)

…aber für XOR-SAT (Konjunktion von XOR-Klauseln)
Mate Soos, Karsten Nohl, Claude Castelluccia: Extending SAT Solvers to Cryptographic Problems SAT 2009

https://github.com/msoos/cryptominisat

…we extended the solver’s input language to support the XOR operation

Lineare Ungleichungen und Optimierung

Entscheidungsproblem:

Eingabe: Constraintsystem,
gesucht: eine erfüllende Belegung

Optimierungsproblem:

Eingabe: Constraintsystem und Zielfunktion (linearer Ausdruck in Unbekannten)
gesucht: eine optimale erfüllende Belegung (d. h. mit größtmöglichem Wert der Zielfunktion)

Standard-Form des Opt.-Problems:
$A\cdot x^T=b, x^T\ge 0$, minimiere $c\cdot x^T$.

Ü: reduziere OP auf Standard-OP, reduziere EP auf OP

Lösungsverfahren für lin. Ungl.-Sys.

Simplex-Verfahren (für OP) (George Dantzig et al., 1947)

Schritte wie bei Gauß-Verfahren für Gleichungssysteme ($=$ entlang einer Randfläche des Simplex zu einer besseren Lösung laufen)

Einzelheiten siehe Vorlesung Numerik/Optimierung

exponentielle Laufzeit im schlechtesten Fall (selten)
polynomielle Algorithmen: Leonid Kachiyan, 1979, Narendra Karmakar 1984.
Fourier (1826)-Motzkin (1936)-Verfahren (für EP)

vgl. mit Elimination durch vollständige Resolution

exponentielle Laufzeit (häufig)

Fourier-Motzkin-Verfahren

Def.: eine Ungls. ist in $x$-Normalform, wenn jede Ungl.

die Form $x$ ($\le \;\mid\; \ge$) (Ausdruck ohne $x$) hat
oder $x$ nicht enthält.

Satz: jedes Ungls. besitzt äquivalente $x$-Normalform.

Def: für Ungls. $U$ in $x$-Normalform:

$U_x^\downarrow := \{ A \mid (x\ge A) \in U\},~ U_x^\uparrow := \{ B \mid (x\le B) \in U\},$

$U_x^- = \{ C \mid C\in U, \text{$C$ enthält $x$ nicht} \}.$

Def: ($x$-Eliminations-Schritt) für $U$ in $x$-Normalform:

$U \to_x \{ A \le B \mid A\in U_x^\downarrow, B\in U_x^\uparrow \} \cup U_x^-$

Satz: ($U$ erfüllbar und $U\to_x V$) $\iff$ ($V$ erfüllbar).

FM-Verfahren: Variablen nacheinander eliminieren.

Aufgaben

Finden Sie eine monotone Interpretation durch eine Gewichtsfunktion für das Wortersetzungssystem
```
(RULES
a a a -> b b,
b b b -> c d ,
c -> a a ,
d -> c )
```
(Quelle: SRS/Zantema/z116.srs aus https://www.lri.fr/~marche/tpdb/tpdb-2.0/, vgl. https://termination-portal.org/wiki/TPDB)

Stellen Sie das passende Ungleichungssystem auf, geben Sie eine (geratene) Lösung an.
Führen Sie das Fourier-Motzkin-Verfahren für dieses Ungleichungssystem durch.
Bestimmen Sie eine Lösung mit GLPK
Bestimmen Sie eine Lösung mit hmatrix-glpk.

Alberto Ruiz, Dominic Steinitz, 2010-2018, Simple interface to linear programming functions provided by GLPK. https://hackage.haskell.org/package/hmatrix-glpk
Finden Sie weitere Systeme aus SRS/Zantema/z101 …z112 mit Gewichtsfunktion.

Vergleichen Sie mit den Lösungen, die in der letzten Termination Competition gefunden wurden. https://termination-portal.org/wiki/Termination_Competition
Vorverarbeitung eines Terminationsproblems durch sparse tiling, dann Gewichtsfunktion: siehe Geser, Hofbauer, Waldmann FSCD 2019 https://drops.dagstuhl.de/opus/volltexte/2019/10528/

beruht auf einer alten und einfachen Idee, Beispiel: 2-Kachelung für $aa\to aba$ ergibt $\{[aa]\to[ab][ba]\}$, Anzahl der $[aa]$ nimmt ab,

das klappt aber nicht immer so einfach (wann nicht?), läßt sich leicht reparieren (wie?)

in zitierter Quelle: Einschränkung der Kachelmenge
cryptominisat: anwenden, Papier lesen, wie wird DPLL/CDCL für XOR-Klauseln angepaßt?

Ganzzahlige lineare Ungleichungen

(Mixed) Integer Programming

“linear program” (LP): lineares Ungleichungssystem mit Unbekannten aus $\mathbb{Q}$
“integer program” (IP): lineares Ungleichungssystem, mit Unbekannten aus $\mathbb{Z}$
“mixed integer program” (MIP): lineares Ungleichungssystem, mit Unbekannten aus $\mathbb{Q}$ und $\mathbb{Z}$
die Komplexität steigt: LP $\in$ P, MIP $\in$ NPc
mit MIP kann man Boolesche Constraints simulieren

…sollte man aber nicht: Boolesche Lösungsverfahren (DPLL, CDCL) sind besser als numerische

MIP-Beispiel

LP-Format mit Abschnitten

General für ganzzahlige Unbekannte
Binary für Unbekannte in $\{0,1\}$

Minimize  obj: y
Subject To
 c1: 2 x  <= 1
 c2: - 2 x + 2 y <= 1
 c3:  2 x + 2 y >= 1
General  x y
End

Lösen mit https://projects.coin-or.org/Cbc:

cbc check.lp solve solu /dev/stdout

Ü: ausprobieren und erklären: nur $x$, nur $y$ ganzzahlig

MIP-Lösungsverfahren

Ansatz: ein MIP $M$ wird gelöst,

indem eine Folge von LP $L_1,\ldots$ gelöst wird.
Def: Relaxation $R(M)$: wie $M$, alle Unbekannten reell.
Einschränkung: für eine ganze Unbekannte $x_i$

falls $\max \{ x_i \mid \vec{x}\in\operatorname{Mod}(R(M))\} = B <\infty$,

füge Constraint $x_i\le \lfloor B \rfloor$ hinzu
Fallunterscheidung (Verzweigung):

wähle eine ganze Unbekannte $x_i$ und $B\in\mathbb{R}$ beliebig:

$\operatorname{Mod}(M) = \operatorname{Mod}(M\cup \{x_i\le\lfloor B\rfloor\}) \cup\operatorname{Mod}(M\cup \{x_i\ge\lceil B\rceil\})$

entspricht decide in DPLL — aber es gibt kein CDCL

SAT als IP, Komplexität von IP

es gilt $\operatorname{\text{SAT}}\le_P \textsf{IP}$

Beweis durch Funktion $T : \text{CNF} \to \text{IP}$ mit
- $T$ ist in Polynomialzeit berechenbar
- $\forall F\in \text{CNF} : F ~ \text{erfüllbar} \iff T(F) ~ \text{lösbar}$
Lösungsidee:
- Variablen von $T(F)$ $=$ Variablen von $F$
- Wertebereich der Variablen ist $\{0,1\}$
- Negation durch Subtraktion, Oder durch Addition, Wahrheit durch $\ge 1$
Folgerung: aus SAT $\in$ NPc folgt IP $\in$ NPc,

deswegen kein IP- oder MIP-Solver in Polynomialzeit (oder P $=$ NP $=$ 1 Million Dollar)

Travelling Salesman als MIP

(dieses Bsp. aus Papadimitriou und Steiglitz:
Combinatorial Optimization, Prentice Hall 1982)

Travelling Salesman:

Instanz: Gewichte $w : \{1,\ldots,n\}^2\to \mathbb{R}_{\ge 0} \cup \{+\infty\}$ und Schranke $s\in R_{\ge 0}$
Lösung: Rundreise mit Gesamtkosten $\le s$

Ansatz zur Modellierung:

Variablen $x_{i,j} \in\{0,1\}$, Bedeutung: $x_{i,j}=1 \iff$ Kante $(i,j)$ kommt in Rundreise vor
Zielfunktion?
Constraints — reicht das: $\sum_i x_{i,j}=1, \sum_j x_{i,j} = 1$ ?

Travelling Salesman als MIP (II)

Miller, Tucker, Zemlin: Integer Programming Formulation and Travelling Salesman Problem JACM 7(1960) 326–329

zusätzliche Variablen $u_1, \ldots, u_n \in \mathbb{R}$
Constraints $C$: $\forall 1\le i \neq j \le n: u_i -u_j+n x_{i,j} \le n-1$

Übung: beweise

für jede Rundreise gibt es eine Belegung der $u_i$, die $C$ erfüllt.
aus jeder Lösung von $C$ kann man eine Rundreise rekonstruieren.

Was ist die anschauliche Bedeutung der $u_i$?

min und max als MIP

kann man den Max-Operator durch lin. Ungln simulieren?

(gibt es äq. Formulierung zu $\max(x,y)=z$?)
Ansatz: $x\le z \wedge y \le z \wedge (x=z \vee y=z)$,

aber das oder ist verboten.

Idee zur Simulation von $A\le B \vee C \le D$:

neue Variable $f\in \{0,1\}$
Constraint $A \le B + \ldots \wedge C \le D + \ldots$

falls eine obere Schranke $S$ für die Werte von $A,B,C,D$ bekannt ist

Übungen zu DL, MIP

Diskussion, Beispiel für TSP als MIP

(es wird kein Kreis, sondern ein Weg bestimmt?)
Formulierung eines SAT-Problems als IP, Lösung mit CBC.
Überdeckungsproblem (möglichst wenige Damen, die das gesamte Schachbrett beherrschen) as IP,

Constraint-System programmatisch erzeugen, z.B. https://hackage.haskell.org/package/limp, Lösen mit https://hackage.haskell.org/package/limp-cbc

Vergleichen mit SAT-Kodierung, Anzahlconstraint mit Bit-Blasting
Auswertung Adventskalender (Aufgaben: 1, 24)

Planung Projekte

(Integer/Real) Difference Logic

Motivation, Definition

viele Scheduling-Probleme enthalten:
- Tätigkeit $i$ dauert $d_i$ Stunden
- $i$ muß beendet sein, bevor $j$ beginnt.
das führt zu Constraintsystem:
- Unbekannte: $t_i =$ Beginn von $i$
- Constraints: $t_i\le t_j - d_i$
das ist Spezialfall eines linearen Ungleichungssystems,

mit einfachem Lösungsverfahren,

wird später verwendet als Unterprogramm in DPLL(T)

Constraint-Graphen für IDL

Für gegebenes IDL-System $S$ konstruiere gerichteten kantenbewerteten Graphen $G$
- Knoten $i$ $=$ Unbekannte $t_i$
- gewichtete Kante $i \stackrel{d}{\to} j$, falls Constraint $t_i \le t_j+d$
beachte: Gewichte $d\in \mathbb{Z}$ (oder $\mathbb{Q}$, ist äquivalent)

(Ü: wenn alle $\ge 0$: Problem ist trivial lösbar. Wie?)
Satz: $S$ lösbar $\iff$ $G$ besitzt keinen gerichteten Kreis mit negativem Gewicht.

(Implikation $\Rightarrow$ ist offensichtlich, wir brauchen $\Leftarrow$)
Ansatz: $t_i=$ minimales Gewicht aller Wege von 1 zu $i$

Diskussion: min existiert nicht? Weg existiert nicht?

Kürzeste Wege in Graphen

(single-source shortest paths)
- Eingabe:
  - gerichteter Graph $G=(V,E)$
  - Kantengewichte $w: E \to\mathbb{R}$
    
    äquivalent: Matrix $w : V\times V \to \mathbb{R}\cup\{+\infty\}$
  - Startknoten $s\in V$
- Ausgabe: Funktion $D: V\to \mathbb{R}\cup\{-\infty,+\infty\}$ mit $\forall x\in V: D(x)=$ minimales Gewicht aller Wege von $s$ nach $x$
der bekannte (und schnelle) Algorithmus von Dijkstra funktioniert nur, falls $\forall i,j: w(i,j)\ge 0$ (Ü: Beispiel)

Lösung: Algorithmus von Bellmann (1958), Ford (1956)

Lösungsidee

iterativer Algorithmus mit Zustand $d : V\to \mathbb{R}\cup \{+\infty\}$.

$d(s) := 0, \forall x\neq s: d(x) := +\infty$
while ēs gibt ēine Kante $i \stackrel{w_{i,j}}\to j$ mit $d(i)+w_{i,j}< d(j)$
$d(j) := d(i) +w_{i,j}$ // Kante $ij$ wird entspannt

jederzeit gilt die Invariante:

$\forall x \in V$: es gibt einen Weg von $s$ nach $x$ mit Gewicht $d(x)$
$\forall x \in V: D(x) \le d(x)$.

verbleibende Fragen:

Korrektheit (falls Termination)
Auswahl der Kante (aus mehreren Kandidaten)
Termination, Laufzeit

Laufzeit

exponentiell viele Relaxations-Schritte:
besser (polynomiell): Bellman-Ford
- for $i$ from $1$ to $|V|$: jede Kante $e\in E$ einmal entspannen
- dann testen, ob alle Kanten entspannt sind,
  
  d. h., $\forall i,j: d(i) + w_{i,j} \ge d(j)$
Wenn nein, dann existiert negativer Kreis. (Beweis?)
Dijkstra ist schneller, aber nur bei Gewichten $\ge 0$ korrekt

Aufgaben Differenz-Logik

beachte: hier System $=$ Konjunktion.
andere Boolesche Kombinationen: später (SMT).

ein unlösbares IDL-System $S$ angeben,

(mit 4 Constraints, so daß jedes echte Unter-System $S'\subsetneqq S$ (mit $\le 3$ Constraints) lösbar ist)

Bellmann-Ford für den Graphen dieses $S$,

Dijkstra für den Graphen dieses $S$.
Wie aufwendig ist die Lösung eines IDL-Systems durch Fourier-Motzkin?

vergleichen mit Laufzeit Bellmann-Ford

SMT (Satisfiability Modulo Theories)

Definition, Lösungsverfahren (Plan)

Erfüllbarkeitsproblem für beliebige boolesche Kombination von atomaren Formeln aus einer Theorie

Beispiel: $(x\ge 3 \vee \neg (x+y\le 4)) \leftrightarrow x> y$
Verfahren: 1. (wirklich) ersetze jedes T-Atom $a_i$
durch eine boolesche Unbekannte $u_i$, erhalte Formel $F$

2. (naiv) für jedes boolesche Modell $b\models F$:
entscheide, ob die Konjunktion der entsprechenden (ggf. negierten) Atome in T erfüllbar ist
(2. besser) DPLL modulo Theory: Verschränkung der booleschen Suche mit T-Erfüllbarkeit für partielle Modelle

SMT-{LIB,COMP}

Standard-Modellierungssprache, Syntax/Semantik-Def:

https://smtlib.cs.uiowa.edu/standard.shtml
Aufgabensammlung: https://smtlib.cs.uiowa.edu/benchmarks.shtml

Kombinatorik, Scheduling, Hard- und Software-Verifikation, … crafted, industrial, (random?)
Wettbewerb: https://smt-comp.github.io/
typische Solver (Beispiele)
- Z3 (Nikolas Bjorner, Leo de Moura et al.) https://github.com/Z3Prover/z3/
- CVC5 (Clark Barrett, Cesare Tinelli et al.) https://cvc5.github.io/

Beispiel `queen10-1.smt2` aus SMT-LIB

(set-logic QF_IDL) (declare-fun x0 () Int)
(declare-fun x1 () Int) (declare-fun x2 () Int)
(declare-fun x3 () Int) (declare-fun x4 () Int)
(assert (let ((?v_0 (- x0 x4)) (?v_1 (- x1 x4))
(?v_2 (- x2 x4)) (?v_3 (- x3 x4)) (?v_4 (- x0 x1))
(?v_5 (- x0 x2)) (?v_6 (- x0 x3)) (?v_7 (- x1 x2))
(?v_8 (- x1 x3)) (?v_9 (- x2 x3))) (and (<= ?v_0 3)
(>= ?v_0 0) (<= ?v_1 3) (>= ?v_1 0) (<= ?v_2 3) (>=
?v_2 0) (<= ?v_3 3) (>= ?v_3 0) (not (= x0 x1))
(not (= x0 x2)) (not (= x0 x3)) (not (= x1 x2))
(not (= x1 x3)) (not (= x2 x3)) (not (= ?v_4 1))
(not (= ?v_4 (- 1))) (not (= ?v_5 2)) (not (= ?v_5
(- 2))) (not (= ?v_6 3)) (not (= ?v_6 (- 3))) (not
(= ?v_7 1)) (not (= ?v_7 (- 1))) (not (= ?v_8 2))
(not (= ?v_8 (- 2))) (not (= ?v_9 1)) (not (= ?v_9
(- 1)))))) (check-sat) (exit)

Umfang der Benchmarks (2014)

http://www.cs.nyu.edu/~barrett/smtlib/?C=S;O=D

QF_BV_DisjunctiveScheduling.zip           2.7G  
QF_IDL_DisjunctiveScheduling.zip          2.4G  
incremental_Hierarchy.zip                 2.1G  
QF_BV_except_DisjunctiveScheduling.zip    1.6G  
QF_IDL_except_DisjunctiveScheduling.zip   417M  
QF_LIA_Hierarchy.zip                      294M  
QF_UFLRA_Hierarchy.zip                    217M  
QF_NRA_Hierarchy.zip                      170M  
QF_LRA_Hierarchy.zip                      160M

QF: quantifier free,
I: integer, R: real, BV: bitvector
D: difference, L: linear, N: polynomial

Anwendung zur Terminations-Analyse

der arktische Halbring: $\mathbb{A}=(\{-\infty\}\cup\mathbb{N},\max,+,-\infty,0)$
$\mathbb{A}^{d\times d}$: quadratische Matizen über $\mathbb{A}$,
$P>Q$ falls $\forall i,j: (P_{i,j}>Q_{i,j}) \vee (P_{i,j}=-\infty=Q_{i,j})$.
Matrix-Interpretation: $i:\Sigma\to\mathbb{A}^{d\times d}$ mit $\forall c: i(c)_{1,1}\ge 0$

Interpretation von Wörtern: $i(c_1 \ldots c_n):=i(c_1)\circ\ldots \circ i(c_n)$

Bsp: $i: a\mapsto \begin{pmatrix}0 &0 \\ 1 & 2 \end{pmatrix} , b\mapsto \begin{pmatrix}0 &-\infty \\ -\infty & -\infty \end{pmatrix}$
$i$ kompatibel mit $R$, falls $\forall (l,r)\in R: i(l)>i(r)$.

Bsp (Fortsetzg.) $i$ kompatibel mit $\{aa \to aba\}$
dann terminiert $R$, denn jede $R$-Ableitung von $w$ aus hat $\le i(w)_{1,1}$ Schritte
für gegebenes $R$ und $d$: Kompatibilitä von $i$ ist Constraint-System in QF_LIA.

e-DSLs für Constraint-Prog.

die Constraint-Sprache $C$ dient zur Kommunikation mit Solver (nicht: mit Anwender/Anwendungsprogrammierer)
Programm in einer Gastsprache $G$ für
- Konstruktion des Constraint-Systems
- Verarbeitung des Resultates (des Modells)
dabei müssen übersetzt werden
- Namen in $C$, Namen in $G$
- Werte in $C$ (symbolisch), Werte in $G$ (tatsächlich)
- Typen in $C$ (Bsp: Bit), in $G$ (Bsp:Bool)
Entwurfs-Ziele:
- symbolisches Programm (in $C$) sieht aus wie tatsächliches Programm (in $G$)
- notwendige Übersetzungen möglichst unsichtbar

Wiederholung: ersatz als e-DSL für SAT

(let b = True in solveWith minisat $ do
  p <- exists @Bit; assert (p === encode b)
  return p
) >>= \ case (Satisfied, Just (p :: Bool)) -> ...

class Codec c where
  type Decoded c
  encode :: Decoded c -> c
  decode :: Belegung -> c -> Decoded c
instance Codec Bit where
  type Decoded Bit = Bool; ...

Ü: überprüfen Sie die Design-Ziele, geben Sie die technischen Mittel an, durch die diese erreicht werden

Beispiel: Python-Bindung für Z3

https://github.com/Z3Prover/z3/blob/master/examples/python/hamiltonian/hamiltonian.py

L = {0:[1,2], 1:[2], 2:[1,0]} # Beispiel-Graph
cv = [Int('cv%s'%i) for i in range(L)]
s = Solver() ; s.add(cv[0]==0)
for i in range(L):
  s.add(Or([cv[j]==(cv[i]+1)%L for j in gr[i]]))
s.check(); print (s.model())

Design-Ziele überprüfen:
- Namen, Typen, Ausdrücke, Übersetzungen, Sichtbarkeit
beachte: hier wird keine SMTLIB-Datei erzeugt, sondern API des Solvers aufgerufen.

Haskell-Bindungen für SMTLIB (Bsp. 1)

Iavor S. Diatchki:

https://hackage.haskell.org/package/simple-smt

s <- newSolver "cvc4" ["--lang=smt2"] Nothing
setLogic s "QF_LIA"
x <- declare s "x" tInt
assert s (add x (int 2) `eq` int 5)
check s
print =<< getExprs s [x]

$C$-Namen sind sichtbar
$C$-Typen (tInt) erscheinen nicht statisch in $G$-Typen
$C$- und $G$-Operatoren: add, +
explizite Rück-Übersetzung (getExprs)

Haskell-Bindungen für SMTLIB (Bsp. 2)

Henning Günther: https://hackage.haskell.org/package/smtlib2

withBackend (createPipe "z3" ["-smt2","-in"]) $ do
 x <- declareVar int; y <- declareVar int
 assert $ x .+. y .==. cint 5
 assert $ x .>. cint 0; assert $ y .>. cint 0
 checkSat
 IntValue vx <- getValue x; IntValue vy <- getValue y
 return (vx,vy)

$C$-Typen erscheinen statisch in $G$-Typen, Bsp:

(.>.) :: (Embed m e, IsSMTNumber tp, HasMonad a, HasMonad b
  , MatchMonad a m, MatchMonad b m
  , MonadResult a ~ e tp, MonadResult b ~ e tp)
  => a -> b -> m (e BoolType)

Aufgaben

Bestimmen Sie:

die kleinste natürliche Zahl, die sich auf zwei verschiedene Weisen als Summe von zwei Kuben schreiben läßt

mit einem SMT-Solver. Schreiben Sie das Constraint-System von Hand. Benutzen Sie Logiken QF_NIA (Polynom-Arithmetik) (Warum nicht QF_LRA?)

Hinweis: die Bedingung die kleinste kann man nicht hinschreiben, aber durch systematisches Probieren realisieren

Lösen Sie nun die gleiche Aufgabe mit QF_BV (Bitvektoren)
Dieses Beispiel in QF_NIA ist wohl zu schwer für heutige Solver:

Andrew R. Booker, Andrew V. Sutherland: On a question of Mordell, https://arxiv.org/abs/2007.01209

John Pavlus: Sum-of-Three-Cubes Problem Solved for ‘Stubborn’ Number 33, https://www.quantamagazine.org/sum-of-three-cubes-problem-solved-for-stubborn-number-33-20190326/
wählen Sie zufällig in SMTLIB eine (quantorenfreie) Logik und dort eine Benchmark. Erklären Sie die Benchmark. Wenden Sie verschiedene SMT-Solver an (z.B. Z3 und Z3++) und vergleichen Sie Laufzeiten. Ändern Sie die Formel (vorsichtig), erläutern Sie die Änderungen der Belegung oder Erfüllbarkeit.
die zitierte Hamiltonkreis-Kodierung (oder die früher zitierte MIP-Kodierung dafür) in SMTLIB-Syntax hinschreiben (in möglichst einfacher Logik) und ausprobieren.
Eine kompatible arktische Matrix-Interpretation für $aa\to aba$ (das Bsp. auf Folie) durch Lösen eines LIA-Systems bestimmen

Desgl. für $a^2 b^2\to b^3 a^3$ (größere Dimension verwenden).

Warum gibt es keine solche Interpretation für $ab\to ba$?

Hinweis: weil diese Regel quadratische lange Ableitungen gestattet (von welchen Startwörtern?),

aber solche können bei arktischen Interpretationen nicht vorkommen (warum?)

Uninterpretierte Funktionen (UF)

Motivation, Definition

Interpretation $\models$ Formel,

Interpretation $=$ (Struktur, Belegung)

Die Theorie $\operatorname{Th}(S)$ einer Struktur $S$ ist Menge aller in $S$ wahren Formeln: $\operatorname{Th}(S)=\{F \mid \forall b: (S,b) \models F \}$

Beispiel 1: Formel $a \cdot b = b \cdot a$ gehört zur $\operatorname{Th}(\text{$\mathbb{N}$ mit Multipl.})$, aber nicht zu $\operatorname{Th}(\text{Matrizen über $\mathbb{N}$ mit Multipl.})$.

Beispiel 2: Formel \[(x = y) \Rightarrow f (f (x)) = f (f (y))\] gehört zu jeder Theorie (mit passender Signatur),

Gleichheit von Termen

In jeder Algebra gelten diese Formeln: \[(t_1=s_1) \wedge \ldots \wedge (t_k=s_k) \to f(t_1,\ldots,t_k) = f(s_1,\ldots,s_k)\] (Leibniz-Axiom für die Gleichheit, functional consistency)

Definition: eine $\Sigma$-Algebra $A$ heißt frei, wenn die Implikation im Leibniz-Axiom eine Äquivalenz ist
Beispiel: jede Termalgebra ist frei.
Nicht-Beispiel: $\Sigma=\{+/2\}, D=\mathbb{N}$ ist nicht frei.
Bsp.: eine freie Algebra auf $\mathbb{N}$ zur Signatur $\{f/2\}$ ist $f(x,y)=2^x\cdot 3^y$ (Satz von Euklid: jede positive natürliche Zahl besitzt genau eine Zerlegung in Primzahlpotenzen)

Anwendungen

Für jede $\Sigma$-Algebra $S$ gilt:

Formel $F$ ist allgemeingültig in der freien $\Sigma$-Algebra
$\Rightarrow$ Formel $F$ ist allgemeingültig in $S$.

Vorteil: kein Entscheidungsverfahren für $S$ nötig

Nachteil: Umkehrung gilt nicht.

Anwendung bei Analyse von Programmen, Schaltkreisen: Unterprogramme (Teilschaltungen) als black box,

Roope Kaivola et al.: Replacing Testing with Formal Verification in Intel CoreTM i7 Processor Execution Engine Validation, Conf. Computer Aided Verification 2009, http://dx.doi.org/10.1007/978-3-642-02658-4_32

Die Logik QF_UF in SMT-LIB

Bsp: die Formel $(x=y) \wedge (f(f(g(x))) \neq f(f(g(y))))$

(set-logic QF_UF) (declare-sort U 0)
(declare-fun f (U) U) (declare-fun g (U) U)
(declare-fun x () U) (declare-fun y () U)
(assert (and (= x y) 
          (not (= (f (f (g x))) (f (f (g y)))))))
(check-sat)

ist nicht erfüllbar,

d. h., das Gegenteil ist allgemeingültig:

\[\forall f,g,x,y: ((x=y)\rightarrow (f(f(g(x))) = f(f(g(y))))\]

Lösungsverfahren für UF

Eingabe: Formel $F$ als Konjunktion von Gleichungen und Ungleichungen auf Termen, Ausgabe: $F$ erfüllbar?

Bsp. $f (a, b) = a \wedge f (f (a, b), b) \neq a$
Verfahren congruence closure (Shostak 1978):
Folge von Partitionen der Menge aller Teilterme

Beginn: jeder Teilterm bildet eine Klasse $\{a\}, \{b\},\{f(a,b)\},\{f(f(a,b),b)\}$, dann wiedeholt:
- für Gleichung: $t_i=t_j$: Klassen vereinigen
- Abschluß unter Symmetrie, Transitivität, Kongruenz
Ausgabe: erfüllbar, wenn kein $t_i\neq t_j$ in einer Klasse
Sekundär-Quelle (z.B.) L. Koller, 2020

https://www21.in.tum.de/teaching/sar/SS20/6.pdf

DPLL(T) (Modulo Theories)

DPLL(T), Prinzip

für jedes T.Atom $A = P(t_1,\ldots,t_k)$
eine boolesche Unbek. $p_A \leftrightarrow A$.

naives Vorgehen:
- für jede Lösung des SAT-Problem für diese Variablen $p_*$:
- bestimme Erfüllbarkeit dieser Konjunkt. von T-Literalen
Realisierung mit DPLL(T):
- decide, $T$-solve (Konjunktion von $T$-Literalen)
- Konflikte (logische und $T$-Konfl.): backtrack
- logische Propagationen, Lernen
- $T$-Propagation ($T$-Deduktion)

DPLL(T), Beispiel QF_LRA

T-Solver für Konjunktion von Literalen

z. B. Simplex, Fourier-Motzkin
T-Konfliktanalyse:

bei Nichterfüllbarkeit liefert T-Solver eine Begründung

$=$ (kleine) nicht erfüllbare Teilmenge (von Literalen $\{a_1,\ldots,a_k\}$), dann Klausel $\neg a_1\vee \ldots\vee \neg a_k$ lernen
T-Deduktion, Bsp: aus $x\le y \wedge y\le z$ folgt $x\le z$

neues (!) Atom $x\le z$ entsteht durch Umformungen während Simplex oder Fourier-Motzkin

betrachte $\neg x\le y \vee \neg y\le z \vee x\le z$ als Konfliktklausel, damit CDCL

DPLL(T): Einzelheiten, Beispiele

Literatur: Robert Niewenhuis et al.: https://www.cs.upc.edu/~roberto/papers/IJCAR2012Slides.pdf
Univ. Barcelona, Spin-Off: Barcelogic, Bsp:

https://barcelogic.com/en/sports-planning/

…software for professional sports scheduling. It has been successfully applied during the last five years in the Dutch professional football (the main KNVB Ere- and Eerste Divisies).

An adequate schedule is not only important for sportive and economical fairness among teams and for public order. It also plays a very important role reducing costs and increasing revenues, e.g., the value of TV rights.

Aufgaben

freie Algebra:
- weitere freie Algebren zu $\Sigma=\{f/2\}$ über $\mathbb{N}$.
- die von $\scriptsize F(x)=\begin{pmatrix}1 & 1 \\ 0 & 1\end{pmatrix}x; ~ \scriptsize G(x)=\begin{pmatrix}2 & 0 \\ 0 & 1\end{pmatrix}x; ~ I()=\begin{pmatrix}1 & 0 \\ 0 & 1\end{pmatrix}$ erzeugte Algebra ist frei?
QF_UF:
1. warum ist diese Formel nicht erfüllbar?
  
  https://clc-gitlab.cs.uiowa.edu:2443/SMT-LIB-benchmarks/QF_UF/-/blob/master/TypeSafe/z3.1184163.smt2
2. Benchmarks
  
  https://clc-gitlab.cs.uiowa.edu:2443/SMT-LIB-benchmarks/QF_UF/-/tree/master/eq_diamond
  
  ausprobieren, angegebene Quelle (SMT 2005) lesen
3. über alle Benchmarks
  
  https://clc-gitlab.cs.uiowa.edu:2443/SMT-LIB-benchmarks/QF_UF/-/tree/master/
  
  welches ist die schwerste (für Z3, für CVC5)?
4. Für quantifiers in the UF theory
  
  https://smt-comp.github.io/2021/system-descriptions/Yices2.pdf
  
  : Beschreibung und Beispiele suchen, Yices installlieren, Beispiele ausprobieren
inkrementeller Theorie-Solver:
1. für QF_IDL (Niewenhuis JACM 2006
  
  https://www.cs.upc.edu/~roberto/papers.html
  
  ), Unterschiede zu nicht inkrementellem Verfahren.
2. für QF_LRA: wie kann man Fourier-Motzkin inkrementell verwenden? (Der Anwendungsfall ist: es taucht eine neue Ungleichung auf, in der Variablen vorkommen, die durch Fourier-Motzkin bereits eliminiert wurden)
DPLL(T) in autotool-Aufgabe
Diskussion zu Projekten

Kombination von Theorien

Beispiele f. Theorie-Kombinationen

(Kroening/Strichman: Kapitel 10)

Lineare Arithmetik $+$ uninterpretierte Funktionen:

$(x_2\ge x_1) \wedge (x_1-x_3\ge x_2) \wedge (x_3\ge 0) \wedge f(f(x_1)-f(x_2)) \neq f(x_3)$
Bitfolgen $+$ uninterpretierte Funktionen:

$f(a[32],b[1])=f(b[32],a[1])\wedge a[32]=b[32]$
Arrays $+$ lineare Arithmetik

$x=\select(\store(v,i,e),j) \wedge y=\select(v,j) \wedge x>e\wedge x>y$

Anwendung: statische Software-Analyse

Patrick M. Rondon, Ming Kawaguchi, Ranjit Jhala: Liquid ($=$ logically qualified) Types, PLDI 2008;

automatically infer dependent types precise enough to prove a variety of safety properties. … decidable logic of equality, uninterpreted functions and linear arithmetic
Niki Vazou, Patrick M. Rondon, Ranjit Jhala: Abstract Refinement Types, ESOP 2013

preserving SMT-based decidability by encoding refinement parameters as uninterpreted propositions within the refinement logic.

https://ucsd-progsys.github.io/liquidhaskell/

type Even = {v:Int | v % 2 = 0 }
maximum :: [Even] -> Even

Definition f. Theorie-Kombination

(Wdhlg) Signatur $\Sigma$, Theorie $T$, Gültigkeit $T \models \phi$

Kombination von Theorien:

…mit disjunkten Signaturen: $\Sigma_1\cap\Sigma_2=\emptyset$
Theorie $T_1$ über $\Sigma_1$, Theorie $T_2$ über $\Sigma_2$.
Theorie $T_1 \oplus T_2$ über $\Sigma_1 \cup \Sigma_2$

Aufgabenstellung:

gegeben: Constraint-Solver (Entscheidungsverfahren) für $T_1$, Constraint-Solver für $T_2$;
gesucht: Constraint-Solver für $T_1 \oplus T_2$

Konvexe Theorien

eine Theorie $T$ heißt konvex, wenn für jede Konjunktion $\phi$ von Atomen, Zahl $n$, Variablen $x_1,\ldots,x_n,y_1,\ldots,y_n$ gilt:

aus $T \models \forall x_1,\ldots,y_1,\ldots: (\phi \rightarrow (x_1=y_1\vee\ldots\vee x_n=y_n))$
folgt: es gibt ein $i$ mit $T \models \forall x_1,\ldots,y_1,\ldots: (\phi \rightarrow ( x_i=y_i))$

Ü: warum heißt das konvex?

Beispiele: konvex oder nicht?

lineare Ungleichungen über $\mathbb{R}$ (ja)
lineare Ungleichungen über $\mathbb{Z}$ (nein)
Konjunktionen von (Un)gleichungen (ja)

Das Nelson-Oppen-Verfahren (Quellen)

Greg Nelson, Derek C. Oppen: Simplification by Cooperating Decision Procedures, ACM TOPLAS 1979, http://doi.acm.org/10.1145/357073.357079
Oliveras und Rogriguez-Carbonell: Combining Decisions Procedures: The Nelson-Oppen Approach,

als Teil der Vorlesung Deduction and Verification Techniques, U Barcelona, 2009 https://www.cs.upc.edu/~oliveras/teaching.html
Tinelli und Harandi: A new Correctness Proof of the Nelson-Oppen Combination Procedure, FROCOS 1996.

http://homepage.cs.uiowa.edu/~tinelli/papers/TinHar-FROCOS-96.pdf

Das Nelson-Oppen-Verfahren: purification

purification (Reinigung):

durch Einführen neuer Variablen:
alle atomaren Formeln enthalten nur Ausdrücke einer Theorie

Beispiel:

vorher: $\phi:=x_1 \le f(x_1)$
nachher: $\phi':= x_1 \le a \wedge a=f(x_1)$

im Allg. $\phi \iff \exists a,\ldots: \phi'$

d. h. $\phi$ erfüllbar $\iff$ $\phi'$ erfüllbar.

Nelson-Oppen für konvexe Theorien

für entscheidbare Theorien $T_1,\ldots,T_n$ (jeweils $T_i$ über $\Sigma_i$)

Eingabe: gereinigte Formel $\phi= \phi_1\wedge\ldots\wedge\phi_n$

(mit $\phi_i$ über $\Sigma_i$)
wenn ein $\phi_i$ nicht erfüllbar, dann ist $\phi$ nicht erfüllbar
wenn $T_i \models (\phi_i \to x_i=y_i)$, dann Gleichung $x_i=y_i$ zu allen $\phi_j$ hinzufügen,…
bis sich nichts mehr ändert, dann $\phi$ erfüllbar

(Beispiele)

(Beweis)

Nelson-Oppen, Beispiel

(Kroening/Strichman, Ex. 10.8)

NO-Verfahren anwenden auf:

$x_2 \ge x_1 \wedge x_1-x_3\ge x_2 \wedge x_3\ge 0 \wedge f(f(x_1)-f(x_2)) \neq f(x_3)$

Diese Beispiel als Constraint-Problem in der geeigneten SMT-LIB-Teilsprache formulieren und mit Z3 Erfüllbarkeit bestimmen.

Anwendg.: Bounded Model Checking

Begriff, Motivation

model checking: feststellen, ob
- ein Modell eines realen Hard- oder Softwaresystems
  
  (z.B. Zustandsübergangssystem f. nebenläufiges Programm)
- eine Spezifikation erfüllt
  
  (z.B. gegenseitiger Ausschluß, Liveness, Fairness)
symbolic model checking:

symbolische Repräsentation von Zustandsfolgen

im Unterschied zu tatsächlicher Ausführung (Simulation)
bounded: für Folgen beschränkter Länge

Literatur, Software

Armin Biere et al.: Symbolic Model Checking without BDDs, TACAS 1999, http://fmv.jku.at/bmc/

Software damals: Übersetzung nach SAT, später: SMT (QB_BV), Solver: http://fmv.jku.at/boolector/
Daniel Kroening und Ofer Strichman: Decision Procedures, an algorithmic point of view, Springer, 2008. http://www.decision-procedures.org/

Software: http://www.cprover.org/cbmc/
Nikolaj Bjørner et al.: Program Verification as Satisfiability Modulo Theories, SMT-Workshop 2012, http://smt2012.loria.fr/

Softw.: https://github.com/Z3Prover/z3/wiki

BMC für Mutual Exclusion-Protokolle

System mit zwei (gleichartigen) Prozessen $A,B$:

A0: maybe goto A1
A1: if l goto A1 else goto A2
A2: l := 1; goto A3
A3: [critical;] goto A4
A4: l := 0; goto A0

B0: maybe goto B1
B1: if l goto B1 else goto B2
B2: l := 1; goto B3
B3: [critical;] goto B4
B4: l := 0; goto B0

Schließen sich A3 und B3 gegenseitig aus? (Nein.)

(nach: Donald E. Knuth: TAOCP, Vol. 4 Fasz. 6, S. 20ff)

Modell: Zustandsübergangssystem

Zustände:

jeder Zustand besteht aus:
- Inhalte der Speicherstellen (hier: $l\in\{0,1\}$)
- Programmzähler (PC) jedes Prozesses
  
  (hier: $A\in\{0 \dots 4\},B\in\{0 \dots 4\}$)
Initialzustand: $I = \{l=0,A=0,B=0\}$
Menge der Fehlerzustände: $F = \{A=3, B=3\}$

Übergangsrelation (nichtdeterministisch): für $P\in \{A,B\}$:

$P$ führt eine Aktion aus (schreibt Speicher, ändert PC)

Aussagenlog. Formel für $I \to^{\le k} F$ angeben,

deren Erfüllbarkeit durch SAT- oder SMT-Solver bestimmen

Übung BMC

Software: https://git.imn.htwk-leipzig.de/waldmann/boumchak
überprüfe 1. gegenseitigen Ausschluß, 2. deadlock, 3. livelock (starvation) für weitere Systeme, z.B.

E. W. Dijkstra, 1965: https://www.cs.utexas.edu/~EWD/transcriptions/EWD01xx/EWD123.html#2.1.

G. L. Peterson, Myths About the Mutual Exclusion Problem, Information Processing Letters 12(3) 1981, 115–116

Theorie der Bitvektoren (QF_BV)

Beispiel, Anwendung, Solver

(declare-fun a () (_ BitVec 12))
(declare-fun b () (_ BitVec 12))
(assert (and
   (bvult (_ bv1 12) a) (bvult (_ bv1 12) b)
   (= (_ bv1001 12) (bvmul a b))))

Verifikation von Hard- und Software für Arithmetik auf Bitfolgen (Maschinenzahlen) fester Länge

(d.h., CPU und maschinen(nahe) Programme)
Aina Niemetz, Mathias Preiner: Bitwuzla, https://bitwuzla.github.io/

gewinnt 26 vonn 56 Kategorien SMT-Comp 2023

Lazy und Eager Approach für QFBV

eager (kennen wir schon) bit-blasting:

unbekannter Bitvektor $=$ Folge unbekannter Bits

QFBV-Constraint $\Rightarrow$ aussagenlog. Formel (mit z.B. Addier-, Multiplizierschaltkreisen)

dann SAT-Solver
lazy: DPLL(T) für $T=$ Theorie der Bitvektoren

(u.a. Assoziativität, Kommutativität von Add., Mult.)

T-Solver löst Konjunktion von T-Literalen
- zunächst symbolisch, erst danach durch …
- bit-blasting,
- lokale Suche (Niemetz, Preiner, ternary propagation based local search, FMCAD 2020

QFBV für arithmetische Constraints

…mit richtigen Zahlen:

z.B., aus Terminationsanalyse (Koeffz. in natürlichen und arktischen Matrizen)

man muß den Überlauf erkennen und verhindern

für Addition: einfach (mit einem Bit mehr rechnen),

für Multiplikation: ?

Zusammenfassung, Ausblick

Kernaussagen

Constraint-Programmierung $=$
- anwendungsspezifische logische Formel,
- generische bereichsspezifische Such/Lösungsverfahren
CP ist eine Form der deklarativen Programmierung
typische Anwendungsfälle für CP mit Formeln ohne Quantoren, mit freien Variablen, Solver sagt:
- JA: beweist Existenz-Aussage, rekonstruiere Lösung der Anwendungsaufgabe aus Modell
- NEIN: das beweist All-Aussage (z. B. Implementierung erfüllt Spezifikation für jede Eingabe)

Kernthemen

Aussagenlogik (SAT)

Grundlagen: Formeln, Resolution, DPLL, CDCL
Anw.: SAT-Kod. für kombinatorische Aufgaben, Forcing,

Prädikatenlogik: Bereiche und -spezifische Verfahren:

Zahlen: Differenzlogik, lineare Ungleichungen (Fourier-Motzkin),
uninterpretierte Funktionen,

Prädikatenlogik: allgemeine und spezielle Verfahren:

Kombination von Theorie-Löser und SAT-Löser (DPLL(T))
Bit-Blasting für finite-domain-Constraints

Typische Anwendungen

Ressourcen-Zuordungs-, -Optimierungs-Aufgaben mit
- nicht linearen Funktionen
- nicht nur konjuktiver Verknüpfung von Teilbedingungen
Hardware-Verifikation: digitale Schaltnetze, Schaltwerke
Software-Verifikation:
- bounded model checking,
- Terminations-Analyse, siehe
  
  Constraint Programming for Analysis of Rewriting, 13th Intl. School on Rewriting, Tbilisi, 2022,
  
  https://www.imn.htwk-leipzig.de/~waldmann/talk/22/isr/

Geschichte der Constraint-Progr. (I)

Lineare Optimierung (Dantzig 1947 et al.)

$\Rightarrow$ Mixed Integer LP (Gomory 195* et al.) https://www-03.ibm.com/ibm/history/exhibits/builders/builders_gomory.html
PROLOG (Kowalski 1974)
- löst Unifikations-Constraints über Bäumen
- mit fixierter Suchstrategie (SLD-Resolution)
$\Rightarrow$ Constraint Logic Programming (spezielle Syntax und Strategien für Arithmetik, endliche Bereiche)

Global constraints in CHIP: Beldiceanu, Contejean 1994

http://dx.doi.org/10.1016/0895-7177(94)90127-9

Geschichte der Constraint-Progr. (II)

fixierte, bekannte Suchstrategie: PROLOG
Strategie innerhalb des CP bestimmt: gecode
(praktisch unbekannte) Strategie im externen Solver:
- SAT
  - DPLL: Martin Davis, Hilary Putnam (1960),
    
    George Logemann, Donald W. Loveland (1962),
  - SAT ist NP-vollst. (Steven Cook, Leonid Levin, 1971)
  - CDCL: J.P Marques-Silva, Karem A. Sakallah (1996)
- SMT
  - DPLL(T): the lazy approach to SMT
  - Yices 2006,
  - Z3 (de Moura, Bjorner, 2008)

Constraints für (baum)strukturierte Daten

Sprache CO4, Dissertation von A. Bau http://abau.org/co4.html
Constraint c :: P -> U -> Bool in Haskell
…das geht in ersatz auch?

Ja — aber nur für $U=$ Bool, [Bool], usw.,
und auch dafür nicht vollständig:

if a == b then c else d && e

$\Rightarrow$ ite (a === b) c (d && e)
CO4 gestattet für $P$ und $U$:
- algebraische Datentypen (data)
- pattern matching (case)

SAT-Kodierung von Bäumen

kodiere (endl. Teilmengen von) algebraischen Datentypen

data U = C1 T11 .. T1i | C2 T21 .. T2j | ..
durch Baum mit Grad $\max(i,j,\ldots)$,

in jedem Knoten die FD-Kodierung des Konstruktor-Index
```
e = case (x :: U) of 
       C1 .. -> e1 ; C2 .. -> e2
```
übersetzt in $\bigwedge_k (\text{index}(x) = k) \Rightarrow (e = e_k)$

Spezifikation, Implementierung, Korrektheit, Anwendungsfälle (Terminations-Analyse, RNA-Design), Messungen, Verbesserungen, Erweiterungen.

siehe Publikationen auf http://abau.org/co4.html

Einleitung

Constraint-Programmierung—Beispiel

Industrielle Anwendungen der CP

Industrielle Anwendungen der CP

CP-Anwendung: Polynom-Interpretationen

Constraints in der Unterhaltungsmathematik

Wettbewerbe für Constraint-Solver

Gliederung der Vorlesung

Organisatorisches

Literatur

Hausaufgaben

Erfüllbarkeit aussagenlogischer Formeln (SAT)

Aussagenlogik: Syntax

Aussagenlogik: Semantik

Modellierung durch SAT: Ramsey

Programmbeispiel zu Ramsey

Benutzung von SAT-Solvern

Modellierung durch SAT: \(N\) Damen

Formulierung von SAT-Problemen mit Ersatz

\(N\)-Queens mit Ersatz

Zusammenfassung Ersatz (bisher)

Hausaufgaben

SAT: Normalformen, Transformationen

Normalformen (DNF, CNF)

Äquivalenzen

Erfüllbarkeits-Äquivalenz

Tseitin-Transformation

Tseitin-Transf. für Schaltkreise

Tseitin-Transformation in Ersatz (Bsp)

Abmessungen von Schaltkreisen

Abmessungen von Schaltkreisen: wozu?

Tseitin-Transformation (Aufgaben)

Anzahl-Constraints

Definition, Motivation

SAT-Kodierung eines Rösselsprungs

SAT-Kodierungen von AMO (I)

SAT-Kodierungen von AMO (II) - log

SAT-Kodierungen von AMO (III) - sqrt

Aufgaben

Komplexität der Erfüllbarkeit

Motivation, Begriffe

Wiederholung: NP-Vollständigkeit

Wiederholung: SAT ist NP-vollständig

Die Tseitin-Transformation

Was nützen diese Aussagen?

SAT-Solver

Spezifikation

Implementierung eines naiven SAT-Solvers

Lösungsverfahren

Evolutionäre Algorithmen für SAT

Lokale Suche (GSat, Walksat)

DPLL

DPLL-Begriffe

DPLL-Algorithmus

DPLL: Eigenschaften

DPLL-Beispiel

DPLL-Beispiel (Lösung)

DPLL: Implement., Heuristik, Ergänzungen

Aufgaben

SAT-Solver (fortgeschrittene Techniken)

Plan

Semantisches Folgern

Resolution

DPLL mit CDCL (Plan)

Naives Lernen

Lernen (Implementierung) und Backjump

Aufgaben

Weitere Anwendungen der Resolution

Überblick

Resolution

Variablen-Elimination durch vollst. Resolution

Resolution als Inferenzsystem

Resolution und Unerfüllbarkeit

Resolution, Bemerkungen

Beweise für Nichterfüllbarkeit

Reverse Unit Propagation

Deletion Resolution Asymmetric Tautology

Übungen

Bitblasting

Definition, Motivation, Beispiel

Beispiel `queen10-1.smt2` aus SMT-LIB