Operações e observáveis de Pauli

As matrizes de Pauli desempenham um papel central no formalismo estabilizador. Vamos começar a lição com uma discussão sobre matrizes de Pauli, incluindo algumas de suas propriedades algébricas básicas, e também discutiremos como as matrizes de Pauli (e produtos tensoriais de matrizes de Pauli) podem descrever medições.

Noções básicas de operações de Pauli

Aqui estão as matrizes de Pauli, incluindo a matriz identidade $2\times 2$ e as três matrizes de Pauli não-identidade.

\mathbb{I} = \begin{pmatrix} 1 & 0\\ 0 & 1 \end{pmatrix} \qquad X = \begin{pmatrix} 0 & 1\\ 1 & 0 \end{pmatrix} \qquad Y = \begin{pmatrix} 0 & -i\\ i & 0 \end{pmatrix} \qquad Z = \begin{pmatrix} 1 & 0\\ 0 & -1 \end{pmatrix}

Propriedades das matrizes de Pauli

Todas as quatro matrizes de Pauli são unitárias e hermitianas. Usamos os nomes $\sigma_x,$ $\sigma_y,$ e $\sigma_z$ para nos referir às matrizes de Pauli não-identidade em partes anteriores da série, mas é convencional usar as letras maiúsculas $X,$ $Y,$ e $Z$ no contexto de correção de erros. Essa convenção foi adotada na lição anterior e continuaremos a fazê-lo nas lições restantes.

Matrizes de Pauli não-identidade diferentes anti-comutam entre si.

XY = -YX \qquad XZ = -ZX \qquad YZ = -ZY

Essas relações de anti-comutação são simples e fáceis de verificar realizando as multiplicações, mas são criticamente importantes no formalismo estabilizador e em outros contextos. Como veremos, os sinais negativos que surgem quando a ordem entre duas matrizes de Pauli não-identidade diferentes é invertida em um produto matricial correspondem precisamente à detecção de erros no formalismo estabilizador.

Também temos as regras de multiplicação listadas aqui.

XX = YY = ZZ = \mathbb{I} \qquad XY = iZ \qquad YZ = iX \qquad ZX = iY

Ou seja, cada matriz de Pauli é sua própria inversa (o que é sempre verdade para qualquer matriz que seja tanto unitária quanto hermitiana), e multiplicar duas matrizes de Pauli não-identidade diferentes resulta sempre em $\pm i$ vezes a matriz de Pauli não-identidade restante. Em particular, a menos de um fator de fase, $Y$ é equivalente a $X Z,$ o que explica nosso foco em erros $X$ e $Z$ e a aparente falta de interesse em erros $Y$ na correção de erros quânticos; $X$ representa um bit-flip, $Z$ representa um phase-flip e, portanto (a menos de uma fase global), $Y$ representa ambos os erros ocorrendo simultaneamente no mesmo qubit.

Operações de Pauli em múltiplos qubits

As quatro matrizes de Pauli representam operações (que podem ser erros) em um único qubit — e ao realizar produtos tensoriais entre elas, obtemos operações em múltiplos qubits. Como ponto de terminologia, quando nos referimos a uma operação de Pauli de $n$ qubits, queremos dizer um produto tensorial de quaisquer $n$ matrizes de Pauli, como nos exemplos mostrados aqui, para os quais $n=9.$

\begin{gathered} \mathbb{I} \otimes \mathbb{I} \otimes \mathbb{I} \otimes \mathbb{I} \otimes \mathbb{I} \otimes \mathbb{I} \otimes \mathbb{I} \otimes \mathbb{I} \otimes \mathbb{I} \\[1mm] X \otimes X \otimes \mathbb{I} \otimes \mathbb{I} \otimes \mathbb{I} \otimes \mathbb{I} \otimes \mathbb{I} \otimes \mathbb{I} \otimes \mathbb{I} \\[1mm] X \otimes Y \otimes Z \otimes \mathbb{I} \otimes \mathbb{I} \otimes \mathbb{I} \otimes X \otimes Y \otimes Z \end{gathered}

Frequentemente, o termo operação de Pauli refere-se a um produto tensorial de matrizes de Pauli junto com um fator de fase, ou às vezes apenas a certos fatores de fase como $\pm 1$ e $\pm i.$ Há boas razões matemáticas para permitir fatores de fase dessa forma — mas, para manter as coisas o mais simples possível, usaremos o termo operação de Pauli neste curso para nos referir a um produto tensorial de matrizes de Pauli sem a possibilidade de um fator de fase diferente de 1.

O peso de uma operação de Pauli de $n$ qubits é o número de matrizes de Pauli não-identidade no produto tensorial. Por exemplo, o primeiro exemplo acima tem peso $0,$ o segundo tem peso $2,$ e o terceiro tem peso $6.$ Intuitivamente, o peso de uma operação de Pauli de $n$ qubits é o número de qubits sobre os quais ela age de forma não trivial. É típico que os códigos de correção de erros quânticos sejam projetados para detectar e corrigir erros representados por operações de Pauli, desde que seu peso não seja muito alto.

Operações de Pauli como geradores

Às vezes é útil considerar coleções de operações de Pauli como geradores de conjuntos (mais especificamente, grupos) de operações, num sentido algébrico que você pode reconhecer se estiver familiarizado com teoria dos grupos. Se você não estiver familiarizado com teoria dos grupos, tudo bem — ela não é essencial para a lição. Familiaridade com os conceitos básicos de teoria dos grupos é, no entanto, fortemente recomendada para quem estiver interessado em explorar a correção de erros quânticos com maior profundidade.

Suponha que $P_1, \ldots, P_r$ sejam operações de Pauli de $n$ qubits. Quando nos referimos ao conjunto gerado por $P_1, \ldots, P_r,$ queremos dizer o conjunto de todas as matrizes que podem ser obtidas multiplicando essas matrizes entre si, em qualquer combinação e em qualquer ordem, usando cada uma quantas vezes quisermos. A notação usada para se referir a esse conjunto é $\langle P_1, \ldots, P_r \rangle.$

Por exemplo, o conjunto gerado pelas três matrizes de Pauli não-identidade é o seguinte.

\langle X, Y, Z \rangle = \bigl\{\alpha P\,:\,\alpha\in\{1,i,-1,-i\},\; P\in\{\mathbb{I},X,Y,Z\} \bigr\}

Isso pode ser deduzido a partir das regras de multiplicação listadas anteriormente. Há 16 matrizes diferentes nesse conjunto, que é comumente chamado de grupo de Pauli.

Em um segundo exemplo, se removermos $Y,$ obtemos metade do grupo de Pauli.

\langle X, Z\rangle = \{ \mathbb{I}, X, Z, -iY, -\mathbb{I}, -X, -Z, iY \}

Aqui está um último exemplo (por ora), desta vez com $n=2.$

\langle X \otimes X, Z \otimes Z\rangle = \{ \mathbb{I}\otimes\mathbb{I}, X\otimes X, Z\otimes Z, -Y\otimes Y \}

Nesse caso, obtemos apenas quatro elementos, devido ao fato de que $X\otimes X$ e $Z\otimes Z$ comutam:

\begin{aligned} (X\otimes X)(Z\otimes Z) & = (XZ) \otimes (XZ)\\ & = (-ZX)\otimes (-ZX)\\ & = (ZX)\otimes (ZX)\\ & = (Z\otimes Z)(X\otimes X). \end{aligned}

Observáveis de Pauli

As matrizes de Pauli, e as operações de Pauli de $n$ qubits de forma mais geral, são unitárias e, portanto, descrevem operações unitárias sobre qubits. Mas elas também são matrizes hermitianas e, por essa razão, descrevem medições, como será explicado a seguir.

Observáveis de matrizes hermitianas

Considere primeiro uma matriz hermitiana arbitrária $A.$ Quando nos referimos a $A$ como um observável, estamos associando a $A$ uma certa medição projetiva uniquamente definida. Em outras palavras, os possíveis resultados são os autovalores distintos de $A,$ e as projeções que definem a medição são aquelas que projetam nos espaços gerados pelos autovetores correspondentes de $A.$ Assim, os resultados de tal medição são números reais — mas, como as matrizes têm apenas finitos autovalores, haverá apenas finitos resultados de medição possíveis para uma dada escolha de $A.$

Em maior detalhe, pelo teorema espectral, é possível escrever

A = \sum_{k = 1}^m \lambda_k \Pi_k

para autovalores reais distintos $\lambda_1,\ldots,\lambda_m$ e projeções $\Pi_1,\ldots,\Pi_m$ satisfazendo

\Pi_1 + \cdots + \Pi_m = \mathbb{I}.

Tal expressão de uma matriz é única a menos da ordenação dos autovalores. Outra forma de dizer isso é que, se insistirmos que os autovalores estejam ordenados em valor decrescente $\lambda_1 > \lambda_2 > \cdots > \lambda_m,$ então há apenas uma maneira de escrever $A$ na forma acima.

Com base nessa expressão, a medição que associamos ao observável $A$ é a medição projetiva descrita pelas projeções $\Pi_1,\ldots,\Pi_m,$ e os autovalores $\lambda_1,\ldots,\lambda_m$ são entendidos como os resultados de medição correspondentes a essas projeções.

Medições a partir de operações de Pauli

Vamos ver como são as medições do tipo recém descrito para operações de Pauli, começando pelas três matrizes de Pauli não-identidade. Essas matrizes têm decomposições espectrais como segue.

\begin{gathered} X = \vert {+} \rangle\langle {+} \vert - \vert {-} \rangle\langle {-} \vert\\ Y = \vert {+i} \rangle\langle {+i} \vert - \vert {-i} \rangle\langle {-i} \vert\\ Z = \vert {0} \rangle\langle {0} \vert - \vert {1} \rangle\langle {1} \vert \end{gathered}

As medições definidas por $X,$ $Y,$ e $Z,$ vistas como observáveis, são, portanto, as medições projetivas definidas pelos seguintes conjuntos de projeções, respectivamente.

\begin{gathered} \bigl\{\vert {+} \rangle\langle {+} \vert, \vert {-} \rangle\langle {-} \vert \bigr\} \\ \bigl\{\vert {+i} \rangle\langle {+i} \vert, \vert {-i} \rangle\langle {-i} \vert\bigr\} \\ \bigl\{\vert {0} \rangle\langle {0} \vert, \vert {1} \rangle\langle {1} \vert\bigr\} \end{gathered}

Em todos os três casos, os dois possíveis resultados de medição são os autovalores $+1$ e $-1.$ Tais medições são comumente chamadas de medições- $X$ , medições- $Y$ e medições- $Z$ . Encontramos essas medições na lição "Medições gerais" de "Formulação geral da informação quântica", onde surgiram no contexto da tomografia de estado quântico.

Claro, uma medição- $Z$ é essencialmente apenas uma medição na base padrão e uma medição- $X$ é uma medição em relação à base mais/menos de um qubit — mas, conforme essas medições são descritas aqui, estamos tomando os autovalores $+1$ e $-1$ como os resultados reais da medição.

A mesma prescrição pode ser seguida para operações de Pauli em $n\geq 2$ qubits, embora deva-se ressaltar que ainda haverá apenas dois resultados possíveis para as medições descritas dessa forma: $+1$ e $-1,$ que são os únicos autovalores possíveis das operações de Pauli. As duas projeções correspondentes terão, portanto, posto maior que um nesse caso. Mais precisamente, para toda operação de Pauli de $n$ qubits não-identidade, o espaço de estados de dimensão $2^n$ sempre se divide em dois subespaços de autovetores de dimensão igual, de modo que as duas projeções que definem a medição associada terão ambas posto $2^{n-1}.$

A medição descrita por uma operação de Pauli de $n$ qubits, considerada como observável, não é a mesma coisa que uma medição em relação a uma base ortonormal de autovetores dessa operação, nem é a mesma coisa que medir independentemente cada uma das matrizes de Pauli correspondentes, como observáveis, em $n$ qubits. Ambas as alternativas necessitariam de $2^n$ possíveis resultados de medição, mas aqui temos apenas os dois resultados possíveis $+1$ e $-1.$

Por exemplo, considere a operação de Pauli de 2 qubits $Z\otimes Z$ como um observável. Podemos efetivamente tomar o produto tensorial das decomposições espectrais para obter uma para o produto tensorial.

\begin{aligned} Z\otimes Z & = (\vert 0\rangle\langle 0\vert - \vert 1\rangle\langle 1\vert) \otimes (\vert 0\rangle\langle 0\vert - \vert 1\rangle\langle 1\vert)\\ & = \bigl( \vert 00\rangle\langle 00\vert + \vert 11\rangle\langle 11\vert \bigr) - \bigl( \vert 01\rangle\langle 01\vert + \vert 10\rangle\langle 10\vert \bigr) \end{aligned}

Ou seja, temos $Z\otimes Z = \Pi_0 - \Pi_1$ para

\Pi_0 = \vert 00\rangle\langle 00\vert + \vert 11\rangle\langle 11\vert \quad\text{and}\quad \Pi_1 = \vert 01\rangle\langle 01\vert + \vert 10\rangle\langle 10\vert,

portanto essas são as duas projeções que definem a medição. Se, por exemplo, medíssemos um estado de Bell $\vert\phi^+\rangle$ de forma não destrutiva usando essa medição, teríamos certeza de obter o resultado $+1,$ e o estado permaneceria inalterado como resultado da medição. Em particular, o estado não colapsaria para $\vert 00\rangle$ ou $\vert 11\rangle.$

Implementação não destrutiva via estimativa de fase

Para qualquer operação de Pauli de $n$ qubits, podemos realizar a medição associada a esse observável de forma não destrutiva usando estimativa de fase.

Aqui está um Circuit baseado em estimativa de fase que funciona para qualquer matriz de Pauli $P,$ onde a medição está sendo realizada no qubit superior. Os resultados $0$ e $1$ da medição na base padrão no Circuit correspondem aos autovalores $+1$ e $-1,$ assim como geralmente ocorre na estimativa de fase com um qubit de controle. (Note que o qubit de controle está na parte inferior neste diagrama, enquanto na lição "Estimativa de fase e fatoração" de "Fundamentos de algoritmos quânticos" os qubits de controle eram desenhados na parte superior.)

Circuit para medir um observável de Pauli usando estimativa de fase

Um método similar funciona para operações de Pauli em múltiplos qubits. Por exemplo, o diagrama de Circuit a seguir ilustra uma medição não destrutiva do observável de Pauli de $3$ qubits $P_2\otimes P_1\otimes P_0,$ para qualquer escolha de $P_0,P_1,P_2 \in \{X,Y,Z\}.$

Circuit para medir um observável de Pauli de 3 qubits usando estimativa de fase

Essa abordagem se generaliza para observáveis de Pauli de $n$ qubits, para qualquer $n,$ de forma natural. É claro que precisamos incluir Gates controladas-unitárias apenas para fatores tensoriais não-identidade dos observáveis de Pauli ao implementar tais medições; Gates controladas-identidade são simplesmente Gates identidade e, portanto, podem ser omitidas. Isso significa que observáveis de Pauli de menor peso requerem Circuits menores para serem implementados por essa abordagem.

Observe que, independentemente de $n,$ esses Circuits de estimativa de fase têm apenas um único qubit de controle, o que é consistente com o fato de que há apenas dois resultados possíveis de medição para essas medições. Usar mais qubits de controle não revelaria informações adicionais, porque essas medições já são perfeitas usando um único qubit de controle. (Uma forma de ver isso é diretamente a partir do procedimento geral de estimativa de fase: a hipótese $U^2 = \mathbb{I}$ torna inúteis quaisquer qubits de controle adicionais além do primeiro.)

Aqui está um exemplo específico de uma implementação não destrutiva de uma medição $Z\otimes Z,$ que é relevante para a descrição do código de repetição de 3 bits como um código estabilizador que veremos em breve.

Circuit para medir um observável ZZ usando estimativa de fase

Nesse caso, e para produtos tensoriais de mais de dois observáveis $Z$ de forma mais geral, o Circuit pode ser simplificado.

Circuit simplificado para medir um observável ZZ

Assim, essa medição é equivalente a medir de forma não destrutiva a paridade (ou XOR) dos estados da base padrão de dois qubits.

Noções básicas de operações de Pauli​

Propriedades das matrizes de Pauli​

Operações de Pauli em múltiplos qubits​

Operações de Pauli como geradores​

Observáveis de Pauli​

Observáveis de matrizes hermitianas​

Medições a partir de operações de Pauli​

Implementação não destrutiva via estimativa de fase​