Ein String stellt eine Kette von Zeichen dar, in der ein Zeichen gleichbedeutend mit einem Byte ist. Das bedeutet, es gibt exakt 256 mögliche Zeichen. Es impliziert zudem, dass PHP keine native Unterstützung von Unicode bietet. Siehe auch Details zum String-Typ.
Hinweis: Unter 32-bit-Versionen kann ein String bis zu 2GB (maximal 2147483647 Bytes) groß werden.
Ein String -Literal kann auf vier unterschiedliche Arten spezifiziert werden:
Der einfachste Weg einen String anzugeben, ist ihn mit
einfachen Anführungszeichen (das Zeichen '
) zu
umschließen.
Um ein einfaches Anführungszeichen hierin anzugeben, fügen sie einen
Backslash (\
) vor dem Zeichen ein. Um einen Backslash
als Zeichen anzugeben, verdoppeln Sie ihn (\\
). Alle
anderen Instanzen von Backslash werden als buchstäblicher Backslash
behandelt: Das bedeutet, dass die anderen Escape-Sequenzen, die Sie
vielleicht gewohnt sind, wie \r
oder
\n
, buchstäblich wie angegeben ausgegeben werden und
keine besondere Bedeutung haben.
Hinweis: Im Gegensatz zu den doppelten Anführungszeichen- und Heredoc-Notationen werden Variablen und Escape-Sequenzen für Sonderzeichen nicht aufgelöst (ersetzt), wenn sie in einem mit einfachen Anführungszeichen umschlossenen String erscheinen.
Beispiel #1 Syntax-Varianten
<?php
echo 'dies ist ein einfacher String', PHP_EOL;
echo 'Sie können auch Zeilenumbrüche
in dieser Art angeben,
dies ist okay so', PHP_EOL;
// Gibt aus: Arnold sagte einst: "I'll be back"
echo 'Arnold sagte einst: "I\'ll be back"', PHP_EOL;
// Ausgabe: Sie löschten C:\*.*?
echo 'Sie löschten C:\\*.*?', PHP_EOL;
// Ausgabe: Sie löschten C:\*.*?
echo 'Sie löschten C:\*.*?', PHP_EOL;
// Ausgabe: Dies erzeugt keinen: \n Zeilenumbruch
echo 'Dies erzeugt keinen: \n Zeilenumbruch', PHP_EOL;
// Ausgabe: Variablen werden $ebenfalls $nicht ersetzt
echo 'Variablen werden $ebenfalls $nicht ersetzt', PHP_EOL;
?>
Wenn der String in doppelte Anführungszeichen
("
) eingeschlossen wird, interpretiert PHP die folgenden
Escape-Sequenzen für Sonderzeichen:
Sequenz | Bedeutung |
---|---|
\n |
Zeilenumbruch (LF or 0x0A (10) in ASCII) |
\r |
Wagenrücklauf (CR or 0x0D (13) in ASCII) |
\t |
horizontaler Tabulator (HT or 0x09 (9) in ASCII) |
\v |
vertikaler Tabulator (VT or 0x0B (11) in ASCII) |
\e |
Escape-Zeichen (ESC or 0x1B (27) in ASCII) |
\f |
Seitenvorschub (FF or 0x0C (12) in ASCII) |
\\ |
Backslash (Rückstrich) |
\$ |
Dollar-Zeichen |
\" |
doppeltes Anführungszeichen |
\[0-7]{1,3} |
Oktal: die Folge von Zeichen, die auf den regulären Ausdruck
[0-7]{1,3} passt, ist ein Zeichen in oktaler
Notation (z. B. "101円" === "A" ), die stillschweigend
überläuft, um in ein Byte zu passen (z. B. "400円" === "000円")
|
\x[0-9A-Fa-f]{1,2} |
Hexadezimal: die Folge von Zeichen, die auf den regulären Ausdruck
[0-9A-Fa-f]{1,2} passt, ist ein Zeichen in
hexadezimaler Schreibweise (z. B. "\x41" === "A" )
|
\u{[0-9A-Fa-f]+} |
Unicode: die Folge von Zeichen, die auf den regulären Ausdruck
[0-9A-Fa-f]+ passt, ist ein Unicode-Codepunkt, der
in der Zeichenkette als UTF-8-Darstellung des Codepunkts ausgegeben
wird. Die geschweiften Klammern in der Zeichenkette sind erforderlich
(z. B. "\u{41}" === "A" )
|
Wie bei String s in einfachen Anführungszeichen wird beim Maskieren aller anderen Zeichen der Backslash mit ausgegeben.
Das Auflösen von Variablen-Namen ist eine der wichtigsten Besonderheiten von in doppelten Anführungszeichen angegebenen String s. Siehe hierzu String-Interpolation für weitere Details.
Eine dritte Möglichkeit, String s zu begrenzen, stellt die
Heredoc-Syntax dar: <<<
. Nach diesem Operator
wird ein beliebiger Bezeichner angegeben, dann eine neue Zeile. Hiernach
folgt der eigentliche String und abschließend erneut der
Bezeichner, um die Auszeichnung abzuschließen.
Der schließende Bezeichner darf durch Leerzeichen oder Tabulatoren eingerückt sein, wobei in diesem Fall die Einrückung aus allen Zeilen des Doc-Strings entfernt wird. Vor PHP 7.3.0 muss der schließende Bezeichner in der ersten Spalte der Zeile beginnen.
Außerdem muss der schließende Bezeichner den gleichen Benennungsregeln folgen wie jeder andere Bezeichner in PHP: Er darf nur alphanumerische Zeichen sowie Unterstriche enthalten und muss mit einem nicht-numerischen Zeichen oder einem Unterstrich beginnen.
Beispiel #2 Grundlegendes Heredoc-Beispiel ab PHP 7.3.0
<?php
// keine Einrückung
echo <<<END
a
b
c
\n
END;
// vier Leerzeichen Einrückung
echo <<<END
a
b
c
END;
Das oben gezeigte Beispiel erzeugt mit PHP 7.3 folgende Ausgabe:
a b c a b c
Wenn der schließende Bezeichner weiter eingerückt ist als alle Zeilen des Textkörpers, wird ein ParseError ausgelöst:
Beispiel #3 Der schließende Bezeichner darf nicht weiter eingerückt sein, als die Zeilen des Textkörpers
<?php
echo <<<END
a
b
c
END;
Das oben gezeigte Beispiel erzeugt mit PHP 7.3 folgende Ausgabe:
Parse error: Invalid body indentation level (expecting an indentation level of at least 3) in example.php on line 4
Wenn der schließende Bezeichner eingerückt ist, können auch Tabulatoren verwendet werden, allerdings dürfen Tabulatoren und Leerzeichen in Bezug auf die Einrückung des schließenden Bezeichners und die Einrückung des Textkörpers (bis zum schließenden Bezeichner) nicht miteinander vermischt werden. In jedem dieser Fälle wird ein ParseError ausgelöst. Diese Whitespace-Einschränkungen wurden aufgenommen, weil die Vermischung von Tabulatoren und Leerzeichen für die Einrückung die Lesbarkeit beeinträchtigt.
Beispiel #4 Unterschiedliche Einrückung für den Bezeichner, der den Textkörper (Leerzeichen) schließt
<?php
// Der gesamte folgende Code funktioniert nicht.
// Unterschiedliche Einrückung für den Bezeichner (Tabulatoren), der den
// Textkörper (Leerzeichen) schließt
{
echo <<<END
a
END;
}
// Vermischung von Leerzeichen und Tabulatoren im Textkörper
{
echo <<<END
a
END;
}
// Vermischung von Leerzeichen und Tabulatoren in der Endmarkierung
{
echo <<<END
a
END;
}
Das oben gezeigte Beispiel erzeugt mit PHP 7.3 folgende Ausgabe:
Parse error: Invalid indentation - tabs and spaces cannot be mixed in example.php line 8
Der schließende Bezeichner für den Textkörper muss nicht von einem Semikolon oder Zeilenumbruch gefolgt werden. Zum Beispiel ist der folgende Code ist ab PHP 7.3.0 erlaubt:
Beispiel #5 Fortsetzen eines Ausdrucks nach einem schließenden Bezeichner
<?php
$values = [<<<END
a
b
c
END, 'd e f'];
var_dump($values);
Das oben gezeigte Beispiel erzeugt mit PHP 7.3 folgende Ausgabe:
array(2) { [0] => string(11) "a b c" [1] => string(5) "d e f" }
Wenn der schließende Bezeichner am Anfang einer Zeile gefunden wurde, dann kann er unabhängig davon, ob er Teil eines anderen Wortes war, als schließender Bezeichner betrachtet werden und führt zu einem ParseError .
Beispiel #6 Ein schließender Bezeichner im Textkörper der Zeichenkette führt zu einem ParseError
<?php
$values = [<<<END
a
b
END ING
END, 'd e f'];
Das oben gezeigte Beispiel erzeugt mit PHP 7.3 folgende Ausgabe:
Parse error: syntax error, unexpected identifier "ING", expecting "]" in example.php on line 5
Um dieses Problem zu vermeiden, ist es ratsam, die einfache Regel zu befolgen: etwas, das im Textkörper vorkommt, nicht als schließenden Bezeichner wählen.
Vor PHP 7.3.0 ist es sehr wichtig, darauf zu achten, dass die Zeile mit
dem schließenden Bezeichner keine anderen Zeichen außer einem Semikolon
(;
) enthalten darf. Das heißt insbesondere auch, dass
der Bezeichner nicht eingerückt werden darf und dass
es vor oder nach dem Semikolon auch keine Leerzeichen oder Tabulatoren
geben darf. Zudem muss das erste Zeichen vor dem schließenden Bezeichner
ein Zeilenumbruch sein, so wie er vom Betriebssystem definiert wird. In
UNIX-Systemen, inlusive macOS, ist dies \n
. Auf den
schließenden Bezeichner muss ebenfalls ein Zeilenumbruch folgen.
Wenn diese Regel gebrochen wird und der schließende Bezeichner nicht valide ist, wird er nicht als Bezeichner angenommen und PHP wird weiter nach einem solchen schließenden Bezeichner suchen. Wird kein gültiger schließender Bezeichner vor dem Dateiende gefunden, gibt PHP einen auf die letzte Zeile der Datei weisenden Parser-Fehler aus.
Beispiel #7 Ungültiges Beispiel vor PHP 7.3.0
<?php
class foo {
public $bar = <<<EOT
bar
EOT;
}
// Identifier must not be indented
?>
Beispiel #8 Gültiges Beispiel, auch vor PHP 7.3.0
<?php
class foo {
public $bar = <<<EOT
bar
EOT;
}
?>
Heredocs, die Variablen enthalten, können nicht für die Initialisierung von Klasseneigenschaften verwendet werden.
Heredoc-Text verhält sich genau wie ein String in doppelten Anführungsstrichen, ohne die doppelten Anführungszeichen. Das bedeutet, dass Anführungszeichen in einem Heredoc nicht maskiert werden müssen, aber die oben aufgeführten Maskierungscodes können trotzdem verwendet werden. Variablen werden aufgelöst, aber wenn komplexe Variablen innerhalb eines Heredocs verwendet werden, ist die gleiche Vorsicht geboten wie bei String s.
Beispiel #9 Beispiel für das Notieren von Heredoc-Strings
<?php
$str = <<<EOD
Ein Beispiel für einen String, der sich
unter Verwendung der heredoc-Syntax
über mehrere Zeilen erstreckt.
EOD;
/* Ein komplexeres Beispiel mit Variablen. */
class foo
{
var $foo;
var $bar;
function __construct()
{
$this->foo = 'Foo';
$this->bar = array('Bar1', 'Bar2', 'Bar3');
}
}
$foo = new foo();
$name = 'MeinName';
echo <<<EOT
Mein Name ist "$name". Ich gebe etwas $foo->foo aus.
Jetzt gebe ich etwas {$foo->bar[1]} aus.
Dies sollte ein großes 'A' ausgeben: \x41
EOT;
?>
Das oben gezeigte Beispiel erzeugt folgende Ausgabe:
Mein Name ist "MeinName". Ich gebe etwas Foo aus. Jetzt gebe ich etwas Bar2 aus. Dies sollte ein großes 'A' ausgeben: A
Es ist auch möglich, die Heredoc-Syntax zu verwenden, um Daten an Funktionsargumente zu übergeben:
Beispiel #10 Beispiel für Heredoc in Argumenten
<?php
var_dump(array(<<<EOD
foobar!
EOD
));
?>
Es ist möglich, statische Variablen und Klasseneigenschaften/Konstanten mit Hilfe der Heredoc-Syntax zu initialisieren:
Beispiel #11 Verwendung von Heredoc zur Initialisierung von statischen Werten
<?php
// Statische Variablen
function foo()
{
static $bar = <<<LABEL
Hier steht nichts drin...
LABEL;
}
// Klasseneigenschaften/Konstanten
class foo
{
const BAR = <<<FOOBAR
Beispiel für eine Konstante
FOOBAR;
public $baz = <<<FOOBAR
Beispiel für eine Eigenschaft
FOOBAR;
}
?>
Der öffnende Heredoc-Bezeichner kann optional in doppelte Anführungszeichen gesetzt werden:
Beispiel #12 Verwendung von doppelten Anführungszeichen in Heredoc
<?php
echo <<<"FOOBAR"
Hallo Welt!
FOOBAR;
?>
Nowdocs sind für Strings in einfachen Anführungszeichen das, was Heredocs
für Strings in doppelten Anführungszeichen sind. Ein Nowdoc wird ähnlich
wie ein Heredoc angegeben, aber innerhalb eines Nowdocs wird
keine String-Interpolation durchgeführt. Das Konstrukt
ist ideal für die Einbettung von PHP-Code oder anderen großen Textblöcken
ohne maskieren zu müssen. Es hat einige Eigenschaften mit dem
<![CDATA[ ]]>
-Konstrukt in SGML gemeinsam, indem
es einen Textblock deklariert, der nicht geparst werden soll.
Ein Nowdoc wird mit der gleichen <<<
-Sequenz
identifiziert, die für Heredocs verwendet wird, aber der nachfolgende
Bezeichner wird in einfachen Anführungszeichen eingeschlossen, z. B.
<<<'EOT'
. Alle Regeln für Heredoc-Bezeichner
gelten auch für Nowdoc-Bezeichner, insbesondere die hinsichtlich des
Aussehens des schließenden Bezeichners.
Beispiel #13 Nowdoc-Beispiel für das Notieren von Strings
<?php
echo <<<'EOD'
Ein Beispiel für einen String, der sich über mehrere Zeilen erstreckt
unter Verwendung der Nowdoc-Syntax. Backslashes werden immer als
Buchstaben behandelt,
z. B. \\ und \'.
EOD;
Das oben gezeigte Beispiel erzeugt folgende Ausgabe:
Ein Beispiel für einen String, der sich über mehrere Zeilen erstreckt unter Verwendung der Nowdoc-Syntax. Backslashes werden immer als Buchstaben behandelt, z. B. \\ und \'.
Beispiel #14 Nowdoc Beispiel für Strings mit Variablen
<?php
class foo
{
public $foo;
public $bar;
function __construct()
{
$this->foo = 'Foo';
$this->bar = array('Bar1', 'Bar2', 'Bar3');
}
}
$foo = new foo();
$name = 'MeinName';
echo <<<'EOT'
Mein Name ist "$name". Ich gebe etwas $foo->foo aus.
Jetzt gebe ich etwas {$foo->bar[1]} aus.
Dies sollte ein großes 'A' ausgeben: \x41
EOT;
?>
Das oben gezeigte Beispiel erzeugt folgende Ausgabe:
Mein Name ist "$name". Ich gebe etwas $foo->foo aus. Jetzt gebe ich etwas {$foo->bar[1]} aus. Dies sollte ein großes 'A' ausgeben: \x41
Beispiel #15 Beispiel für statische Daten
<?php
class foo {
public $bar = <<<'EOT'
bar
EOT;
}
?>
Wenn ein string in doppelten Anführungszeichen oder mit Heredoc angegeben wird, können die Variablen darin ersetzt werden.
Es gibt zwei Arten von Syntax: eine einfache und eine erweiterte. Die einfache Syntax ist die gebräuchlichste und bequemste. Sie bietet eine Möglichkeit, eine Variable, einen Array -Wert oder eine Objekt -Eigenschaft mit minimalem Aufwand in einen String einzubetten.
Die komplexe Syntax erkennt man an den geschweifte Klammern, die den Ausdruck umgeben.
Wenn ein Dollarzeichen ($
) erkannt wird, werden die
darauf folgenden Zeichen, die in einem Variablennamen verwendet werden
können, als solche interpretiert und ersetzt.
Beispiel #16 String-Interpolation
<?php
$juice = "apple";
echo "He drank some $juice juice." . PHP_EOL;
?>
Das oben gezeigte Beispiel erzeugt folgende Ausgabe:
He drank some apple juice.
Formal ist die Struktur für die grundlegende Syntax der Ersetzung von Variablen wie folgt:
String-Variable:: Variablen-Name (Offset-oder-Eigenschaft)? | ${ Ausdruck } Offset-oder-Eigenschaft:: Offset-im-String | Eigenschaft-im-String Offset-im-String:: [ Name ] | [ Variablen-Name ] | [ Ganzzahl-Literal ] Eigenschaft-im-String:: -> Name Variablen-Name:: $ Name Name:: [a-zA-Z_\x80-\xff][a-zA-Z0-9_\x80-\xff]*
Die Syntax ${ expression }
ist seit PHP 8.2.0
veraltet, da sie als
variable Variable
interpretiert werden kann:
<?php
const foo = 'bar';
$foo = 'foo';
$bar = 'bar';
var_dump("${foo}");
var_dump("${(foo)}");
?>
Das oben gezeigte Beispiel erzeugt mit PHP 8.2 folgende Ausgabe:
Deprecated: Using ${var} in strings is deprecated, use {$var} instead in file on line 6 Deprecated: Using ${expr} (variable variables) in strings is deprecated, use {${expr}} instead in file on line 9 string(3) "foo" string(3) "bar"
Das oben gezeigte Beispiel erzeugt folgende Ausgabe:
string(3) "foo" string(3) "bar"
Hinweis: Wenn es nicht möglich ist, einen gültigen Namen zu bilden, bleibt das Dollarzeichen unverändert im String erhalten:
<?php
echo "Für $ wurde keine Interpolation durchgeführt\n";
echo "Für $\n wurde keine Interpolation durchgeführt\n";
echo "Für 2ドル wurde keine Interpolation durchgeführt\n";
?>Das oben gezeigte Beispiel erzeugt folgende Ausgabe:
Für $ wurde keine Interpolation durchgeführt Für $ wurde keine Interpolation durchgeführt Für 2ドル wurde keine Interpolation durchgeführt
Beispiel #17 Interpolieren des Wertes der ersten Dimension eines Arrays oder einer Eigenschaft
<?php
$juices = array("apple", "orange", "string_key" => "purple");
echo "He drank some $juices[0] juice.";
echo PHP_EOL;
echo "He drank some $juices[1] juice.";
echo PHP_EOL;
echo "He drank some $juices[string_key] juice.";
echo PHP_EOL;
class A {
public $s = "string";
}
$o = new A();
echo "Wert des Objekts: $o->s.";
?>
Das oben gezeigte Beispiel erzeugt folgende Ausgabe:
He drank some apple juice. He drank some orange juice. He drank some purple juice. Wert des Objekts: string.
Hinweis: Der Array-Schlüssel muss nicht in Anführungszeichen gesetzt werden, daher ist es nicht möglich, mit der einfachen Syntax auf eine Konstante als Schlüssel zu verweisen. Verwenden Sie stattdessen die erweiterte Syntax.
Seit PHP 7.1.0 werden auch negative numerische Indizes unterstützt.
Beispiel #18 Negative numerische Indizes
<?php
$string = 'string';
echo "Das Zeichen an Index -2 ist $string[-2].", PHP_EOL;
$string[-3] = 'o';
echo "Die Änderung des Zeichens an Index -3 auf o ergibt $string.", PHP_EOL;
?>
Das oben gezeigte Beispiel erzeugt folgende Ausgabe:
Das Zeichen an Index -2 ist n. Die Änderung des Zeichens an Index -3 auf o ergibt strong.
Für alles, das komplexer ist, muss die erweiterte Syntax verwendet werden.
Die erweiterte Syntax ermöglicht die Interpolation von Variablen mit beliebigen Zugriffsmethoden.
Jede skalare Variable, jedes Array-Element oder jede Objekteigenschaft
(static oder nicht) mit einer
String -Darstellung kann über diese Syntax eingebunden werden.
Der Ausdruck wird so geschrieben, wie er auch außerhalb des
String s erscheinen würde, und dann von {
und }
umschlossen. Da {
nicht
maskiert werden kann, wird diese Syntax nur erkannt werden, wenn das
$
unmittelbar auf das {
folgt.
Verwenden Sie {\$
, um ein wörtliches
{$
zu erhalten. Einige Beispiele, um es zu
verdeutlichen:
Beispiel #19 Syntax mit geschweiften Klammern
<?php
const DATA_KEY = 'const-key';
$great = 'fantastisch';
$arr = [
'1',
'2',
'3',
[41, 42, 43],
'key' => 'Indexierter Wert',
'const-key' => 'Schlüssel mit Minuszeichen',
'foo' => ['foo1', 'foo2', 'foo3']
];
// Funktioniert nicht, Ausgabe: Das ist { fantastisch}
echo "Das ist { $great}";
// Funktioniert, Ausgabe: Das ist fantastisch
echo "Das ist {$great}";
class Square {
public $width;
public function __construct(int $width) { $this->width = $width; }
}
$square = new Square(5);
// Funktioniert
echo "Dieses Quadrat ist {$square->width}00 Zentimeter breit.";
// Funktioniert, Anführungszeichen funktionieren nur mit der
// Syntax der geschweiften Klammer
echo "Das funktioniert: {$arr['key']}";
// Funktioniert
echo "Das funktioniert: {$arr[3][2]}";
echo "Das funktioniert: {$arr[DATA_KEY]}";
// Verwenden Sie bei mehrdimensionalen Arrays immer geschweifte Klammern
// um die Arrays, wenn diese innerhalb von Strings stehen
echo "Das funktioniert: {$arr['foo'][2]}";
echo "Das funktioniert: {$obj->values[3]->name}";
echo "Das funktioniert: {$obj->$staticProp}";
// Funktioniert nicht, Ausgabe: C:\directory\{fantastisch}.txt
echo "C:\directory\{$great}.txt";
// Funktioniert, Ausgabe: C:\folder\fantastisch.txt
echo "C:\\directory\\{$great}.txt";
?>
Hinweis: Da diese Syntax beliebige Ausdrücke erlaubt, ist es möglich, variable Variablen innerhalb der erweiterten Syntax zu verwenden.
Auf ein Zeichen in einem String kann zugegriffen und es kann geändert werden, indem seine Position (von 0 an) hinter dem String mit Hilfe von Array -Klammern angegeben wird, z. B. $str[42]. In diesem Fall ist es hilfreich, sich einen String als ein Array von Zeichen vorzustellen. Die Funktionen substr() und substr_replace() können verwendet werden, wenn mehr als ein Zeichen extrahiert oder ersetzt werden soll.
Hinweis: Seit PHP 7.1.0 werden auch negative String-Offsets unterstützt. Diese geben den Offset vom Ende des Strings an. Früher verursachten negative Offsets beim Lesen eine
E_NOTICE
-Meldung aus (was einen leeren String ergibt) und beim Schreiben eineE_WARNING
-Meldung (was den String unangetastet lässt).
Hinweis: Vor PHP 8.0.0 konnte für den gleichen Zweck auch mit Klammern auf String s zugegriffen werden, wie in $str{42}. Diese Syntax mit geschweiften Klammern ist seit PHP 7.4.0 veraltet und wird seit PHP 8.0.0 nicht mehr unterstützt.
Das Schreiben an einen Offset außerhalb des vorhandenen Bereichs bewirkt,
dass der String bis zu dieser Position mit Leerzeichen aufgefüllt wird.
Nicht-ganzzahlige Offsets werden in einen ganzzahligen Wert umgewandelt.
Bei ungültigen Offset-Typen wird eine E_WARNING
ausgegeben. Nur das erste Zeichen eines zugewiesenen Strings wird
verwendet. Seit PHP 7.1.0 führt die Zuweisung eines leeren Strings zu
einem schwerwiegenden Fehler. Vorher wurde ein NULL-Byte zugewiesen.
Intern sind PHP-Strings Byte-Arrays. Folglich ist der Zugriff auf einen String oder dessen Änderung mit Array-Klammern nicht Multi-Byte-sicher und sollte nur mit Strings erfolgen, die in einer Ein-Byte-Kodierung wie ISO-8859-1 vorliegen.
Hinweis: Seit PHP 7.1.0 führt die Anwendung des leeren Indexoperators auf einen leeren String zu einem fatalen Fehler. Zuvor wurde der leere String stillschweigend in ein Array umgewandelt.
Beispiel #20 Einige String-Beispiele
<?php
// Ermitteln des ersten Zeichens eines Strings.
$str = 'Das ist ein Test.';
$first = $str[0];
var_dump($first);
// Ermitteln des dritten Zeichens eines Strings.
$third = $str[2];
var_dump($third);
// Ermitteln das letzten Zeichens eines Strings.
$str = 'Das ist immer noch ein Test.';
$last = $str[strlen($str)-1];
var_dump($last);
// Ändern des letzten Zeichens eines Strings.
$str = 'Look at the sea';
$str[strlen($str)-1] = 'e';
var_dump($str);
?>
String-Offsets müssen entweder Integer oder Integer-ähnliche Strings sein, andernfalls wird eine Warnung ausgelöst.
Beispiel #21 Beispiel für unzulässige String-Offsets
<?php
$str = 'abc';
$keys = [ '1', '1.0', 'x', '1x' ];
foreach ($keys as $keyToTry) {
var_dump(isset($str[$keyToTry]));
try {
var_dump($str[$keyToTry]);
} catch (TypeError $e) {
echo $e->getMessage(), PHP_EOL;
}
echo PHP_EOL;
}
?>
Das oben gezeigte Beispiel erzeugt folgende Ausgabe:
bool(true) string(1) "b" bool(false) Cannot access offset of type string on string bool(false) Cannot access offset of type string on string bool(false) Warning: Illegal string offset "1x" in Standard input code on line 10 string(1) "b"
Hinweis:
Der Zugriff auf Variablen anderer Typen (ohne Arrays oder Objekte, die entsprechende Schnittstellen implementieren) mit
[]
oder{}
gibt stillschweigendnull
zurück.
Hinweis:
Auf Zeichen innerhalb von String-Literalen kann mit
[]
oder{}
zugegriffen werden.
Hinweis:
Der Zugriff auf Zeichen innerhalb von String-Literalen mit der
{}
-Syntax ist seit PHP 7.4 veraltet und wurde in PHP 8.0 entfernt.
String s können mit dem Punkt-Operator '.' verkettet werden. Es ist zu beachten, dass der Additions-Operator '+' in diesem Fall nicht funktioniert. Siehe String-Operatoren für mehr Informationen.
Es gibt eine Reihe nützlicher Funktionen für die String -Manipulation.
Siehe den Abschnitt String-Funktionen für allgemeine Funktionen und die Funktionen für Perl-kompatible reguläre Ausdrücke für erweiterte Funktionen zum Suchen und Ersetzen.
Außerdem gibt es Funktionen für URL-Strings und Funktionen zum Verschlüsseln/Entschlüsseln von Strings (Sodium und Hash).
Siehe zudem auch die Zeichentyp-Funktionen.
Ein Wert kann mit dem Schlüsselwort (string)
oder der
Funktion strval() in einen String
umgewandelt werden. Die Umwandlung in einen String erfolgt
automatisch im Kontext eines Ausdrucks, in dem ein String
erforderlich ist. Dies geschieht z. B. bei der Verwendung der Funktionen
echo oder print oder wenn eine
Variable mit einem String verglichen wird. In den Abschnitten
über Typen und
Typ-Manipulationen
werden die folgenden Punkte näher erläutert. Siehe auch die Funktion
settype() .
Ein bool true
-Wert wird in den String
"1"
umgewandelt. bool false
wird in
""
(den leeren String) umgewandelt. Dies ermöglicht es,
zwischen bool - und String -Werten hin und her zu
konvertieren.
Ein Int oder Float wird in einen
String umgewandelt, der die Zahl textuell darstellt
(einschließlich des Exponententeil bei Float s).
Gleitkommazahlen können mit der Exponentialschreibweise umgewandelt werden
(4.1E+6
).
Hinweis:
Seit PHP 8.0.0 ist das Dezimalpunktzeichen immer ein Punkt ("
.
"). Vor PHP 8.0.0 wird das Dezimalpunktzeichen in der Locale des Skripts definiert (Kategorie LC_NUMERIC). Siehe die Funktion setlocale() .
Array s werden immer in
String -"Arrays"
umgewandelt; aus diesem
Grund können echo und print nicht
von sich aus den Inhalt eines Array s anzeigen. Um ein
einzelnes Element anzuzeigen, verwendet man eine Konstruktion wie
echo $arr['foo']
. Siehe unten für Tipps zur Anzeige
des gesamten Inhalts.
Um Objekt e in String s umzuwandeln, muss die magische Methode __toString verwendet werden.
Ressource n werden immer mit der Struktur
"Resource id #1"
in String s umgewandelt,
wobei 1
die Ressourcennummer ist, die der
Ressource von PHP zur Laufzeit zugewiesen wird. Obwohl man
sich nicht auf die genaue Struktur dieses Strings verlassen sollte und sie
sich ändern kann, wird sie für eine bestimmte Ressource innerhalb der
Lebensdauer eines ausgeführten Skripts (d. h. einer Web-Anfrage oder eines
CLI-Prozesses) immer eindeutig sein und wird nicht wiederverwendet. Um den
Typ einer Ressource zu erhalten, kann die Funktion
get_resource_type() verwendet werden.
null
wird immer in einen leeren String umgewandelt.
Wie oben erwähnt, liefert die direkte Umwandlung eines Array s, Objekt s oder einer Ressource in einen String keine nützlichen Informationen über den Wert, die über seinen Typ hinausgehen. Um den Inhalt dieser Typen zu ermitteln, siehe die Funktionen print_r() und var_dump() .
Die meisten PHP-Werte können zur dauerhaften Speicherung auch in String s umgewandelt werden. Diese Methode wird Serialisierung genannt und wird von der Funktion serialize() durchgeführt.
Der Typ string ist in PHP als ein Array von Bytes und einem
Integer, der die Länge des Puffers angibt, implementiert. Er hat keine
Informationen darüber, wie diese Bytes in Zeichen umgewandelt werden; diese
Aufgabe wird dem Programmierer überlassen. Es gibt keine Beschränkungen für
die Werte, aus denen der String bestehen kann; insbesondere Insbesondere
sind Bytes mit dem Wert 0
("NUL-Bytes") in der
Zeichenkette erlaubt (allerdings können einige Funktionen, die in diesem
Handbuch als nicht "binärsicher" eingestuft werden, die Strings an
Bibliotheken weitergeben, die Daten nach einem NUL-Byte ignorieren).
Diese Eigenschaft des String-Typs erklärt, warum es in PHP keinen separaten "Byte"-Typ gibt - Strings übernehmen diese Rolle. Funktionen, die keine textuellen Daten zurückgeben - zum Beispiel beliebige Daten, die von einem Netzwerksocket gelesen werden - geben immer noch Strings zurück.
Da PHP keine spezifische Kodierung für Strings vorschreibt, könnte man sich
fragen, wie String-Literale kodiert werden. Ist zum Beispiel der String
"á"
äquivalent zu "\xE1"
(ISO-8859-1), "\xC3\xA1"
(UTF-8, C-Form),
"\x61\xCC\x81"
(UTF-8, D-Form) oder zu irgendeiner
anderen möglichen Darstellung? Die Antwort lautet, dass der String auf die
Art und Weise kodiert wird, wie er in der Skriptdatei kodiert ist. Wenn das
Skript also in ISO-8859-1 geschrieben ist, wird die Zeichenkette in
ISO-8859-1 kodiert und so weiter. Das gilt jedoch nicht, wenn
Zend-Multibyte aktiviert ist; in diesem Fall kann das Skript in einer
beliebigen Kodierung geschrieben werden (die explizit deklariert ist oder
erkannt wird) und dann in eine bestimmte interne Kodierung konvertiert
werden, welche dann die Kodierung ist, die für die String-Literale
verwendet wird. Es ist zu beachten, dass es einige Beschränkungen für die
Kodierung des Skripts gibt (oder für die interne Kodierung gibt, sollte
Zend-Multibyte aktiviert sein) - das bedeutet fast immer, dass diese
Kodierung eine kompatible Obermenge von ASCII sein sollte, wie z. B. UTF-8
oder ISO-8859-1. Es ist jedoch zu beachten, dass zustandsabhängige
Kodierungen, bei denen dieselben Byte-Werte sowohl im Anfangszustand als
auch im Nicht-Anfangszustand verwendet werden können, problematisch sein
können.
Um nützlich zu sein, müssen Funktionen, die mit Text arbeiten, natürlich Annahmen darüber treffen, wie der String kodiert ist. Leider gibt es in diesem Punkt viele Unterschiede zwischen den PHP-Funktionen:
u
verwendet wird).
Letztlich bedeutet dies, dass das Schreiben korrekter Programme mit Unicode davon abhängt, Funktionen, die nicht funktionieren und die Daten höchstwahrscheinlich beschädigen, sorgfältig zu vermeiden und stattdessen die Funktionen zu verwenden, die sich korrekt verhalten. Im Allgemeinen sind das die Funktionen der intl- und mbstring-Erweiterungen. Die Verwendung von Funktionen, die Unicode-Kodierungen verarbeiten können, ist jedoch nur der Anfang. Unabhängig von den Funktionen, die die Sprache zur Verfügung stellt, ist es wichtig, die Unicode-Spezifikation zu kennen. Ein Programm, das zum Beispiel davon ausgeht, dass es nur Groß- und Kleinbuchstaben gibt, geht von einer falschen Annahme aus.
The documentation does not mention, but a closing semicolon at the end of the heredoc is actually interpreted as a real semicolon, and as such, sometimes leads to syntax errors.
This works:
<?php
$foo = <<<END
abcd
END;
?>
This does not:
<?php
foo(<<<END
abcd
END;
);
// syntax error, unexpected ';'
?>
Without semicolon, it works fine:
<?php
foo(<<<END
abcd
END
);
?>
In PHP 8.2 using ${var} in strings is deprecated, use {$var} instead:
<?php
$juice = "apple";
// Valid. Explicitly specify the end of the variable name by enclosing it in braces:
echo "He drank some juice made of {$juice}s.";
?>
You can use the complex syntax to put the value of both object properties AND object methods inside a string. For example...
<?php
class Test {
public $one = 1;
public function two() {
return 2;
}
}
$test = new Test();
echo "foo {$test->one} bar {$test->two()}";
?>
Will output "foo 1 bar 2".
However, you cannot do this for all values in your namespace. Class constants and static properties/methods will not work because the complex syntax looks for the '$'.
<?php
class Test {
const ONE = 1;
}
echo "foo {Test::ONE} bar";
?>
This will output "foo {Test::one} bar". Constants and static properties require you to break up the string.
md5('240610708') == md5('QNKCDZO')
This comparison is true because both md5() hashes start '0e' so PHP type juggling understands these strings to be scientific notation. By definition, zero raised to any power is zero.
easy transparent solution for using constants in the heredoc format:
DEFINE('TEST','TEST STRING');
$const = get_defined_constants();
echo <<<END
{$const['TEST']}
END;
Result:
TEST STRING
Simple function to create human-readably escaped double-quoted strings for use in source code or when debugging strings with newlines/tabs/etc.
<?php
function doubleQuote($str) {
$ret = '"';
for ($i = 0, $l = strlen($str); $i < $l; ++$i) {
$o = ord($str[$i]);
if ($o < 31 || $o > 126) {
switch ($o) {
case 9: $ret .= '\t'; break;
case 10: $ret .= '\n'; break;
case 11: $ret .= '\v'; break;
case 12: $ret .= '\f'; break;
case 13: $ret .= '\r'; break;
default: $ret .= '\x' . str_pad(dechex($o), 2, '0', STR_PAD_LEFT);
}
} else {
switch ($o) {
case 36: $ret .= '\$'; break;
case 34: $ret .= '\"'; break;
case 92: $ret .= '\\\\'; break;
default: $ret .= $str[$i];
}
}
}
return $ret . '"';
}
?>
<?php
\\Example # 10 Simple Syntax - Solution for the last "echo" line.
class people {
public $john = "John Smith";
public $jane = "Jane Smith";
public $robert = "Robert Paulsen";
public $smith = "Smith";
}
$people = new people();
echo "$people->john then said hello to $people->jane.".PHP_EOL;
echo "$people->john's wife greeted $people->robert.".PHP_EOL;
echo "$people->robert greeted the two $people->smiths";
\\Won't work
\\Outputs: Robert Paulsen greeted the two
/**Solution:**\
echo "$people->robert greeted the two $people->smith\x08s";
\\Will work
\\Outputs: Robert Paulsen greeted the two Smiths
?>
Here is a possible gotcha related to oddness involved with accessing strings by character past the end of the string:
$string = 'a';
var_dump($string[2]); // string(0) ""
var_dump($string[7]); // string(0) ""
$string[7] === ''; // TRUE
It appears that anything past the end of the string gives an empty string.. However, when E_NOTICE is on, the above examples will throw the message:
Notice: Uninitialized string offset: N in FILE on line LINE
This message cannot be specifically masked with @$string[7], as is possible when $string itself is unset.
isset($string[7]); // FALSE
$string[7] === NULL; // FALSE
Even though it seems like a not-NULL value of type string, it is still considered unset.
Leading zeroes in strings are (least-surprise) not treated as octal.
Consider:
$x = "0123" + 0;
$y = 0123 + 0;
echo "x is $x, y is $y"; //prints "x is 123, y is 83"
in other words:
* leading zeros in numeric literals in the source-code are interpreted as "octal", c.f. strtol().
* leading zeros in strings (eg user-submitted data), when cast (implicitly or explicitly) to integer are ignored, and considered as decimal, c.f. strtod().
To save Your mind don't read previous comments about dates ;)
When both strings can be converted to the numerics (in ("$a" > "$b") test) then resulted numerics are used, else FULL strings are compared char-by-char:
<?php
var_dump('1.22' > '01.23'); // bool(false)
var_dump('1.22.00' > '01.23.00'); // bool(true)
var_dump('1-22-00' > '01-23-00'); // bool(true)
var_dump((float)'1.22.00' > (float)'01.23.00'); // bool(false)
?>
String conversion to numbers.
Unfortunately, the documentation is not correct.
«The value is given by the initial portion of the string. If the string starts with valid numeric data, this will be the value used. Otherwise, the value will be 0 (zero).»
It is not said and is not shown in examples throughout the documentation that, while converting strings to numbers, leading space characters are ignored, like with the strtod function.
<?php
echo " \v\f \r 1234" + 1; // 1235
var_export ("\v\f \r 1234" == "1234"); // true
?>
However, PHP's behaviour differs even from the strtod's. The documentation says that if the string contains a "e" or "E" character, it will be parsed as a float, and suggests to see the manual for strtod for more information. The manual says
«A hexadecimal number consists of a "0x" or "0X" followed by a nonempty sequence of hexadecimal digits possibly containing a radix character, optionally followed by a binary exponent. A binary exponent consists of a 'P' or 'p', followed by an optional plus or minus sign, followed by a nonempty sequence of decimal digits, and indicates multiplication by a power of 2.»
But it seems that PHP does not recognise the exponent or the radix character.
<?php
echo "0xEp4" + 1; // 15
?>
strtod also uses the current locale to choose the radix character, but PHP ignores the locale, and the radix character is always 2E. However, PHP uses the locale while converting numbers to strings.
With strtod, the current locale is also used to choose the space characters, I don't know about PHP.
<?php
function doubleQuote($str) {
$ret = '"';
for ($i = 0, $l = strlen($str); $i < $l; ++$i) {
$o = ord($str[$i]);
if ($o < 31 || $o > 126) {
switch ($o) {
case 9: $ret .= '\t'; break;
case 10: $ret .= '\n'; break;
case 11: $ret .= '\v'; break;
case 12: $ret .= '\f'; break;
case 13: $ret .= '\r'; break;
default: $ret .= '\x' . str_pad(dechex($o), 2, '0', STR_PAD_LEFT);
}
} else {
switch ($o) {
case 36: $ret .= '\$'; break;
case 34: $ret .= '\"'; break;
case 92: $ret .= '\\\\'; break;
default: $ret .= $str[$i];
}
}
}
return $ret . '"';
}
?>
Here is an easy hack to allow double-quoted strings and heredocs to contain arbitrary expressions in curly braces syntax, including constants and other function calls:
<?php
// Hack declaration
function _expr($v) { return $v; }
$_expr = '_expr';
// Our playground
define('qwe', 'asd');
define('zxc', 5);
$a=3;
$b=4;
function c($a, $b) { return $a+$b; }
// Usage
echo "pre {$_expr(1+2)} post\n"; // outputs 'pre 3 post'
echo "pre {$_expr(qwe)} post\n"; // outputs 'pre asd post'
echo "pre {$_expr(c($a, $b)+zxc*2)} post\n"; // outputs 'pre 17 post'
// General syntax is {$_expr(...)}
?>